比 ChatGPT 更強(qiáng)大,微軟推出全能型人工智能模型 Kosmos-1 |
發(fā)布時(shí)間:2023-03-05 文章來(lái)源:本站 瀏覽次數(shù):2284 |
3 月 4 日音訊,基于 ChatGPT 的必應(yīng)聊天曾經(jīng)讓不少用戶感遭到了 AI 的強(qiáng)大,而微軟于近日推出了更為強(qiáng)悍的全能型 AI--Kosmos-1。ChatGPT 是純文本 LLM,而它是更強(qiáng)大的多形式大型言語(yǔ)模型(MLLM)。
Kosmos-1 能夠剖析圖像的內(nèi)容、處理視覺(jué)難題、執(zhí)行視覺(jué)文本辨認(rèn)、經(jīng)過(guò)視覺(jué)智商測(cè)試以及了解自然言語(yǔ)指令等等。 IT之家從報(bào)道中得悉,Kosmos-1 能夠處置文本、音頻、圖像和視頻等內(nèi)容,構(gòu)建一個(gè)全能型的人工智能,能夠像人類思想一樣來(lái)處置任務(wù)。 研討人員在他們的學(xué)術(shù)論文中寫(xiě)道:“作為智能的根本組成局部,多模態(tài)感知是完成人工智能的必要條件”。Kosmos-1 論文中的視覺(jué)示例顯現(xiàn)模型剖析圖像并答復(fù)有關(guān)圖像的問(wèn)題,從圖像中讀取文本,為圖像編寫(xiě)標(biāo)題,并以 22-26% 的精確度停止視覺(jué)智商測(cè)試。 微軟表示,它方案向開(kāi)發(fā)人員提供 Kosmos-1,雖然該論文援用的 GitHub 頁(yè)面在本文發(fā)表時(shí)沒(méi)有明顯的 Kosmos 特定代碼。 |
|