(SeaPRwire) – สตาร์ทอัพด้าน AI อย่าง Deeptune ได้ระดมทุนรอบ Series A มูลค่า 43 ล้านดอลลาร์สหรัฐ เพื่อสร้างสิ่งที่บริษัทเรียกว่า “โรงยิมฝึกฝน” (training gyms) สำหรับ AI agents โดยมี Andreessen Horowitz เป็นผู้นำในการระดมทุนรอบนี้ ร่วมด้วย 776, Abstract Ventures และ Inspired Capital รวมถึงนักลงทุนอิสระอย่าง Noam Brown นักวิจัยจาก OpenAI, Brendan Foody ซีอีโอของ Mercor และ Yash Patil ซีอีโอของ Applied Compute
Deeptune สร้างสภาพแวดล้อมการเรียนรู้แบบเสริมกำลัง (Reinforcement Learning – RL) ที่มีความแม่นยำสูง ซึ่งจำลองขั้นตอนการทำงานประจำวันของบทบาทต่างๆ เช่น นักบัญชี, เจ้าหน้าที่ฝ่ายสนับสนุนลูกค้า และวิศวกร DevOps เพื่อให้ AI agents สามารถเรียนรู้การจัดการกับงานหลายขั้นตอนผ่านซอฟต์แวร์ที่ใช้ในที่ทำงานทั่วไป เช่น Slack, Salesforce และเครื่องมือด้านการจัดการตั๋ว การเงิน และการตรวจสอบอื่นๆ “เราสร้างแบบจำลองการทำงานดิจิทัลที่ดูเหมือนพื้นที่ทำงานของนักบัญชี ทนายความ หรือวิศวกรซอฟต์แวร์ขึ้นมา” Tim Lupo ผู้ร่วมก่อตั้งและซีอีโอของ Deeptune กล่าวกับเรา
Lupo เปรียบเทียบโมเดลในปัจจุบันเหมือนกับนักบินที่ “เคยแต่อ่านหนังสือหรือดูวิดีโอสอนเท่านั้น” เขากล่าวว่า “คุณคงไม่ให้นักบินที่เคยแต่อ่านหนังสือหรือดูวิดีโอสอนมาขับเครื่องบิน แต่คุณจะให้พวกเขาเข้าไปอยู่ในเครื่องจำลองการบิน สิ่งที่เราสร้างขึ้นก็คือเครื่องจำลองการบินสำหรับ AI ที่ต้องทำงานในภาคเศรษฐกิจต่างๆ”
การเดิมพันของ Deeptune สะท้อนให้เห็นถึงการเปลี่ยนแปลงในวงการ AI จากการฝึกฝนบนข้อมูลขนาดใหญ่บนเว็บแบบคงที่ ไปสู่การใช้การเรียนรู้แบบเสริมกำลังขนาดใหญ่ในสภาพแวดล้อมสังเคราะห์และเชิงโต้ตอบ ซึ่งเป็นทิศทางที่เห็นได้จากงานวิจัยด้าน Agentic RL เกี่ยวกับ AI ที่ใช้เครื่องมือที่ Microsoft และ OpenAI กำลังพัฒนา โดยตลาดการเรียนรู้แบบเสริมกำลังทั่วโลก ซึ่งรวมถึงเครื่องมือและสภาพแวดล้อมต่างๆ คาดว่าจะเติบโตจากประมาณ 1.16 หมื่นล้านดอลลาร์ในปี 2025 ไปสู่กว่า 9 หมื่นล้านดอลลาร์ภายในปี 2034 ตามข้อมูลของ ResearchAndMarkets
“แทนที่จะพึ่งพาข้อมูลที่มนุษย์เป็นผู้ระบุ (human-annotated data) เป็นหลัก โมเดลต่างๆ กำลังเรียนรู้ผ่านการโต้ตอบ การรันสถานการณ์จำลอง การลงมือทำ และการได้รับรางวัลในสภาพแวดล้อมแบบไดนามิกที่ทำหน้าที่เหมือนสนามเด็กเล่น” Marco Mascorro หุ้นส่วนของ Andreessen Horowitz กล่าวกับเรา “Deeptune ได้สร้างแพลตฟอร์มที่เอื้อต่อการเปลี่ยนแปลงนี้ ทำให้ห้องปฏิบัติการชั้นนำสามารถฝึกฝนและประเมินพฤติกรรมเหล่านี้ได้อย่างน่าเชื่อถือและขยายขนาดได้ Tim และทีมงานมีความเข้าใจอย่างลึกซึ้งและมีประสบการณ์ในการทำงานร่วมกับห้องปฏิบัติการวิจัย AI ระดับแนวหน้าในปัญหาเหล่านี้”
บริษัทระบุว่าได้สร้างโรงยิมฝึกฝนเหล่านี้หลายร้อยแห่งให้กับห้องปฏิบัติการ AI ชั้นนำ และสภาพแวดล้อมของบริษัทได้มีส่วนช่วยในความก้าวหน้าล่าสุดของความสามารถในการ ‘ใช้งานคอมพิวเตอร์’ ของ AI agents ซึ่งก้าวข้ามไปไกลกว่าการตอบคำถามง่ายๆ ไปสู่ขั้นตอนการทำงานที่ซับซ้อนบนซอฟต์แวร์จริง “เราเป็นบริษัทแรกที่สร้างสภาพแวดล้อมนี้ขึ้นมาเมื่อปีกว่าๆ ที่แล้ว และตอนนั้นยังไม่มีใครรู้แน่ชัดว่ามันจะเวิร์กไหม” Lupo กล่าวกับเรา “ตอนนี้เรารู้แล้วว่ามันทำงานได้ดีอย่างเหลือเชื่อ” ตามคำกล่าวของเขา อะไรก็ตามที่สามารถสรุปออกมาเป็นสภาพแวดล้อมได้ “ตั้งแต่การตัดต่อวิดีโอไปจนถึงการทำ LBO ใน Excel” คือสิ่งที่ AI สามารถเรียนรู้ได้
ความต้องการดังกล่าวทำให้สภาพแวดล้อม RL กลายเป็นหมวดหมู่โครงสร้างพื้นฐานใหม่ที่กำลังมาแรง โดยมีห้องปฏิบัติการขนาดใหญ่รายงานว่ากำลังพิจารณาที่จะใช้จ่ายเงินมากกว่าหนึ่งพันล้านดอลลาร์กับสภาพแวดล้อมเหล่านี้ และบริษัทที่ทำหน้าที่ติดป้ายกำกับข้อมูล (data-labeling) ก็กำลังเร่งสร้างข้อเสนอของตนเองขึ้นมาเช่นกัน
ในขณะที่นักลงทุน รวมถึง Marc Andreessen เตือนว่าบริษัท AI กำลัง ‘ขาดแคลน’ ข้อมูลคุณภาพสูงจากมนุษย์ และผลการศึกษาคาดการณ์ว่าข้อมูลบนเว็บสาธารณะสำหรับการฝึกฝนอาจหมดลงภายในทศวรรษหน้า Deeptune นำเสนอพื้นที่ทำงานจำลองของตนว่าเป็นวิธีสร้างประสบการณ์ที่เข้มข้นและเฉพาะเจาะจงสำหรับโมเดล โดยให้พวกมันฝึกฝนภายในสภาพแวดล้อมองค์กรที่สมจริง แทนที่จะเพียงแค่คัดลอกข้อมูลจากอินเทอร์เน็ตสาธารณะ “ผมคิดว่านี่จะกลายเป็นจุดเน้นหลักของข้อมูลโดยทั่วไป คือเราจะสร้างสภาพแวดล้อมที่สมจริงซึ่งดูเหมือนองค์กรที่ [โมเดล] อาจถูกนำไปใช้งานได้อย่างไร” Lupo กล่าว
ทีมงานประมาณ 20 คนที่ทำงานในสำนักงานตั้งอยู่ที่นิวยอร์ก ประกอบด้วยวิศวกรและผู้ปฏิบัติงานจาก Anthropic, Scale AI, Palantir, Hebbia, Glean และ Retool ตามข้อมูลของบริษัท Lupo มองว่านิวยอร์กเป็นทางเลือกที่ตั้งใจและเป็นข้อได้เปรียบในการสรรหาบุคลากร: “หากคุณต้องการอยู่ในนิวยอร์กและต้องการทำงานด้าน AI ระดับแนวหน้าหรือ AGI, Deeptune คือหนึ่งในไม่กี่แห่งที่คุณสามารถเข้าร่วมได้ และน่าจะเป็นบริษัทระยะเริ่มต้นเพียงแห่งเดียวที่คุณสามารถเข้าร่วมได้” เขากล่าว “ปัญหาสำคัญของห้าปีข้างหน้าคือ คุณจะทำให้โมเดลทำงานได้ไม่เพียงแค่ในการสอบที่กำหนดไว้ แต่ในโลกแห่งความเป็นจริงที่วุ่นวายได้อย่างไร… นั่นคือสิ่งที่เราทำที่นี่”
บทความนี้ให้บริการโดยผู้ให้บริการเนื้อหาภายนอก SeaPRwire (https://www.seaprwire.com/) ไม่ได้ให้การรับประกันหรือแถลงการณ์ใดๆ ที่เกี่ยวข้องกับบทความนี้
หมวดหมู่: ข่าวสําคัญ ข่าวประจําวัน
SeaPRwire จัดส่งข่าวประชาสัมพันธ์สดให้กับบริษัทและสถาบัน โดยมียอดการเข้าถึงสื่อกว่า 6,500 แห่ง 86,000 บรรณาธิการและนักข่าว และเดสก์ท็อปอาชีพ 3.5 ล้านเครื่องทั่ว 90 ประเทศ SeaPRwire รองรับการเผยแพร่ข่าวประชาสัมพันธ์เป็นภาษาอังกฤษ เกาหลี ญี่ปุ่น อาหรับ จีนตัวย่อ จีนตัวเต็ม เวียดนาม ไทย อินโดนีเซีย มาเลเซีย เยอรมัน รัสเซีย ฝรั่งเศส สเปน โปรตุเกส และภาษาอื่นๆ
