Ha a célzott teszteléseken ilyen gyengén teljesített a mesterséges intelligencia, hogyan lehetséges, hogy vannak olyan cégek, akik komplett humán erőforrásokat küldenek el, hogy helyettesítsék őket AI-jal? A kutatók arra jutottak, hogy nem képesek az embert helyettesíteni.
Kövesd Telegram csatornánkat!
Folyamatosan frissítjük a közel-keleti háború híreivel
és az orosz-ukrán konfliktus rövid híreivel is
Rábízták egy cég vezetését a mesterséges intelligenciára: az eredmény sokat elárul a munka jövőjéről. Kiderült, képesek-e helyettesíteni az emberi munkaerőt.
A Carnegie Mellon Egyetem kutatói egy kísérlet keretében mesterséges intelligencia (MI) ügynököket alkalmaztak egy szimulált vállalat irányítására, hogy felmérjék, milyen mértékben képesek ezek az MI-ügynökök emberi dolgozókat helyettesíteni.
A kutatók különböző MI modelleket alkalmaztak, köztük az Anthropic Claude 3.5 Sonnet, az OpenAI GPT-4o, a Google Gemini 2.0 Flash, az Amazon Nova, a Meta Llama és az Alibaba Qwen rendszereit. A FUTURA cikke szerint ezeket az ügynököket különböző vállalati szerepkörökbe helyezték. Például pénzügyi elemző, projektmenedzser és szoftvermérnök pozíciókba. A feladatok között szerepelt adatbázisok elemzése, virtuális irodahelyiségek kiválasztása és más osztályokkal való együttműködés.
Eredmény
A legjobban teljesítő MI, a Claude 3.5 Sonnet, a feladatok mindössze 24 százalékát tudta teljes mértékben elvégezni, míg a részben teljesített feladatokat is figyelembe véve ez az arány 34,4 százalék volt. A második helyen a Gemini 2.0 Flash végzett, amely csak 11,4 százalékos teljesítményt ért el. A többi MI ügynök 10 százalék alatti eredményeket produkált.
A kutatók megállapították, hogy az MI-k gyakran nem értették meg az utasítások implicit részeit. Például, ha egy feladat során egy „.docx” kiterjesztésű fájl létrehozása volt a cél, az MI-k nem mindig ismerték fel, hogy ez egy Microsoft Word dokumentumot jelent. Továbbá, az MI-k hiányos szociális készségekkel rendelkeztek, és nehézségekbe ütköztek a webes navigáció során, különösen a felugró ablakok kezelésében. Előfordult, hogy az MI-k kihagyták a bonyolultabb feladatokat, és úgy vélték, hogy sikeresen teljesítették azokat.
A kísérlet eredményei azt mutatják, hogy bár az MI-k bizonyos specifikus feladatokban jól teljesíthetnek, jelenleg még nem képesek teljes mértékben helyettesíteni az emberi munkavégzést egy vállalaton belül. Az MI-k alkalmazása továbbra is kiegészítő szerepet tölthet be, és nem helyettesítheti az emberi munkaerőt.
Felesleges alkalmazottak, akik csak “akadályok” – MI korszakba lépett a Duolingo is
(nlc.hu nyomán Szent Korona Rádió)