A 3D számítógépes látás és a multimodális AI egyik vezető szakértője szerint a gépi érzékelés legnagyobb fordulópontja 2021 körül következett be, amikor a nagy nyelvi modellek előretörése gyorsan éreztette hatását a háromdimenziós látás területén is.
A fekete doboz problémája
A legfontosabb változás az általános célú, teljes munkafolyamatot lefedő modellek megjelenése volt. Míg korábban egymáshoz illesztett algoritmusláncok kezelték a feladatokat, ma egyre inkább egyetlen modell végzi el ugyanazt elejétől a végéig. Ez azonban komoly kockázattal jár: ezek a rendszerek hatalmas fekete dobozokká válnak, amelyek belső működése átláthatatlan. Tombari szerint ez ipari folyamatokban, robotikában és önvezetésben kritikus probléma — ha valami hibázik, tudni kell, hol és miért. Éppen ezért kerül egyre nagyobb hangsúlyba az AI megmagyarázhatósága.
Deepfake-ek és szerzői jogok
A vizuális generatív AI területén a megmagyarázhatóságnál is sürgetőbb kérdés a tartalmak azonosíthatósága. Tombari szerint nagyon közel vagyunk ahhoz a ponthoz, ahol az átlagfelhasználó már nem képes megkülönböztetni az AI által generált videót a valóditól — és pontosan ezért kell mielőbb bevezetni a védelmi mechanizmusokat, például a vízjelezést. A kereskedelmi modelleknél a szerzői jogilag védett anyagok kezelésére is egyértelmű szabályokra van szükség.
Tér, immerzió, világmodellek
A videókból és fényképekből generált immerzív 3D környezetek nem csupán a szórakoztatóipart forradalmasíthatják — autonóm rendszerek és robotok tanításához is értékes szintetikus adatokat állíthatnak elő. Tombari hangsúlyozza: a geometriai hűség alapkövetelmény. Ha a virtuális tér torzul, a robot rossz adatokon tanul navigálni, az önvezető jármű pedig nem lesz képes biztonságosan közlekedni.
Öt év múlva
A szakértő szerint az igazi áttörés az lesz, ha a térbeli intelligencia képessé teszi az autonóm ágensek következő generációját arra, hogy valóban cselekedjenek és tárgyakat kezeljenek a fizikai világban. Ehhez azonban párhuzamosan kell fejlődnie mind az AI-nak, mind a robotikai eszközöknek.
Forrás: HUN-REN Magyar Kutatási Hálózat, továbbította a Helló Sajtó! Üzleti Sajtószolgálat.
A teljes interjút ezen az oldalon tudja elolvasni.

