OpenAI發(fā)布首款A(yù)I智能體Operator:可控制瀏覽器自動完成購物、訂餐等任務(wù)

1月24日消息,OpenAI昨日發(fā)布首款AI智能體Operator,能夠代理用戶執(zhí)行基于網(wǎng)頁的操作。

據(jù)悉,Operator向美國的Pro版訂閱用戶開放,后續(xù)將擴(kuò)展到Plus、Team和Enterprise用戶,并在未來將這些功能集成到ChatGPT中。

據(jù)介紹,Operator由一個名為CUA的新模型驅(qū)動,結(jié)合了GPT-4o的視覺能力,以及通過強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)的高級推理。

經(jīng)過訓(xùn)練后,Operator能夠“看見”瀏覽器的內(nèi)容,并使用鼠標(biāo)和鍵盤允許的所有操作與網(wǎng)頁進(jìn)行互動。例如,在官方演示了讓Operator預(yù)定飯店和去購物網(wǎng)站購物等案例。

不過,OpenAI也提醒使用者,雖然Operator已經(jīng)是市面上最強(qiáng)的AI代理,但與人類相比依然差得很遠(yuǎn),所以這項(xiàng)新技術(shù)仍有可能犯錯,但會在未來數(shù)月里持續(xù)改進(jìn)。(蕭?。?/p>

2025-01-24
OpenAI發(fā)布首款A(yù)I智能體Operator:可控制瀏覽器自動完成購物、訂餐等任務(wù)
1月24日消息,OpenAI昨日發(fā)布首款A(yù)I智能體Operator,能夠代理用戶執(zhí)行基于網(wǎng)頁的操作。

長按掃碼 閱讀全文