本報記者 王鏡茹
近期國內(nèi)多家企業(yè)在“大模型+機(jī)器人”已實(shí)現(xiàn)技術(shù)突破。
業(yè)內(nèi)認(rèn)為,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的擴(kuò)大,多模態(tài)大模型與機(jī)器人的需求將會不斷增加,為企業(yè)提供了廣闊市場空間。此外,與其他行業(yè)的合作也將為多模態(tài)大模型與機(jī)器人的發(fā)展帶來新機(jī)遇,例如與醫(yī)療、制造等行業(yè)的合作,可實(shí)現(xiàn)更廣泛的應(yīng)用場景和商業(yè)價值。
多模態(tài)機(jī)器人實(shí)現(xiàn)技術(shù)突破
截至12月13日收盤,步科股份、埃夫特、綠的諧波等多只機(jī)器人概念股漲超4%。消息面上,特斯拉發(fā)布Optimus-Gen2(第二代擎天柱)人形機(jī)器人視頻,其搭載由特斯拉設(shè)計(jì)的執(zhí)行器與傳感器,行走速度提高30%,平衡力及全身控制均得到提高。
“多模態(tài)”AI是指能處理文本、音頻、圖像、視頻和代碼等多種形式內(nèi)容的大模型。隨著多模態(tài)大模型快速迭代,國際大廠不斷關(guān)注其在機(jī)器人領(lǐng)域的應(yīng)用,并在機(jī)器人規(guī)劃、控制、導(dǎo)航等主要任務(wù)上進(jìn)行了探索。
止于至善投資總經(jīng)理何理告訴《證券日報》記者:“多模態(tài)大模型融合視覺、語音和傳感器數(shù)據(jù)處理技術(shù),極大豐富了機(jī)器人認(rèn)知和決策層面。該技術(shù)在機(jī)器人中的應(yīng)用,有望使機(jī)器人在復(fù)雜交互、自然語言理解和環(huán)境適應(yīng)等領(lǐng)域邁出重大進(jìn)步,激發(fā)其作為高度自主助手或勞動力的無限可能性。”
國內(nèi)已有企業(yè)在此領(lǐng)域搶先布局。12月12日晚,奧比中光發(fā)布大模型機(jī)械臂1.0產(chǎn)品,可通過語音Prompts作為輸入,利用多種大模型的理解能力和視覺感知能力,生成空間語義信息,讓機(jī)械臂理解、執(zhí)行動作。在其同步披露的視頻中,機(jī)械臂成功完成了一系列語音口令,包括“把綠色方塊放到黃色框中”“請恢復(fù)最開始的狀態(tài)”等。
奧比中光聯(lián)合創(chuàng)始人、CTO肖振中告訴《證券日報》記者:“公司希望通過工程化研究,使大模型機(jī)械臂在實(shí)際場景落地,包括提升機(jī)械臂自動繞開復(fù)雜障礙物來完成人類指令的能力,解決大模型+機(jī)械臂的泛化性問題,最終實(shí)現(xiàn)通用場景落地。”
據(jù)不完全統(tǒng)計(jì),中科創(chuàng)達(dá)、億嘉和等上市公司亦于近期相繼披露了基于多模態(tài)大模型的機(jī)器人研發(fā)進(jìn)展情況。
商業(yè)大規(guī)模應(yīng)用仍需時間
我國機(jī)器人行業(yè)已具備一定產(chǎn)業(yè)基礎(chǔ)。頭腦聰明、四肢靈活得多的模態(tài)機(jī)器人正成為多方競逐未來產(chǎn)業(yè)的新賽道。
何理認(rèn)為,在國內(nèi)市場,企業(yè)已積極投入關(guān)鍵技術(shù)環(huán)節(jié)的研發(fā)和生產(chǎn),尤其是在傳感器、精密機(jī)械部件、執(zhí)行器以及創(chuàng)新材料和輕量化結(jié)構(gòu)件領(lǐng)域,展示了蓬勃發(fā)展勢頭。
諧波減速器是工業(yè)機(jī)器人的核心零部件。綠的諧波披露,已較早完成工業(yè)機(jī)器人諧波減速器技術(shù)研發(fā)并實(shí)現(xiàn)規(guī)模化生產(chǎn),在該領(lǐng)域率先實(shí)現(xiàn)了對進(jìn)口產(chǎn)品的替代,極大降低了國產(chǎn)機(jī)器人企業(yè)的采購成本及采購周期。其推出的新一代Y系列諧波減速器,通過數(shù)理模型創(chuàng)新,軸承設(shè)計(jì)及加工工藝優(yōu)化,其剛度指標(biāo)較現(xiàn)有其他產(chǎn)品提升了一倍。
不過,部分業(yè)內(nèi)人士認(rèn)為,“多模態(tài)+機(jī)器人”還處于發(fā)展階段,實(shí)現(xiàn)商業(yè)化落地仍面臨不少挑戰(zhàn)。
“首先,技術(shù)成熟度較低,存在技術(shù)瓶頸。例如模型的可解釋性、穩(wěn)定性、安全性等方面還需進(jìn)一步提升;其次,大模型和機(jī)器人的研發(fā)和生產(chǎn)成本較高,維護(hù)和運(yùn)營成本也相對較高,需投入大量人力、物力資源。”郭濤說。
肖振中對此表示認(rèn)同,他告訴《證券日報》記者:“大語言模型(Large Language Model,LLM)結(jié)合視覺傳感,會讓各類機(jī)器人、機(jī)械臂落地到更多場景中,如工業(yè)制造、柔性物流、商用服務(wù)等。目前大模型跟實(shí)際數(shù)據(jù)的結(jié)合還存在一定差距,大模型運(yùn)行消耗的算力也偏大,應(yīng)用需要三五年的時間逐步落地,業(yè)務(wù)成熟可能需要更久。”
“但公司堅(jiān)信這是正確的方向,前景廣闊。”肖振中表示,奧比中光正搭建機(jī)器人及AI視覺中臺,通過多模態(tài)視覺大模型及智能算法研發(fā),結(jié)合機(jī)器人視覺傳感器,形成自主移動定位導(dǎo)航和避障的完整產(chǎn)品方案,積極迎接智能機(jī)器人時代。
(編輯 孫倩)
中央經(jīng)濟(jì)工作會議定調(diào)2025 任務(wù)要點(diǎn)全面解讀
分析當(dāng)前經(jīng)濟(jì)形勢,部署2025年經(jīng)濟(jì)工作……[詳情]
12:00 | 財(cái)務(wù)造假觸及重大違法強(qiáng)制退市 ... |
12:07 | 國內(nèi)首個干細(xì)胞藥物獲批上市 行業(yè)... |
12:05 | 特變電工取得新年“開門紅” 助力... |
12:04 | 貴州茅臺酒(笙樂飛天)即將發(fā)布 ... |
12:02 | 地方國企扎堆入場 低空經(jīng)濟(jì)將迎爆... |
12:00 | 2024年超六成ETF浮盈 3只產(chǎn)品吸金... |
11:58 | 開年即開工 多地重大項(xiàng)目密集開工... |
11:56 | 華發(fā)股份股票回購順利推進(jìn) 穩(wěn)居行... |
11:55 | 比亞迪啟動30億元教育慈善基金 |
09:04 | 聚焦高質(zhì)量發(fā)展問計(jì)問需 上交所走... |
09:03 | “新年推送”釋放積極信號 滬市龍... |
23:55 | 煉石航空擬向法院申請重整及預(yù)重整 |
版權(quán)所有證券日報網(wǎng)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營許可證B2-20181903
京公網(wǎng)安備 11010202007567號京ICP備17054264號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險自負(fù)。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
掃一掃,即可下載
掃一掃,加關(guān)注
掃一掃,加關(guān)注