Kineski istraživači na pragu su revolucionarnog pristupa razvoju "naučnika s umjetnom inteligencijom (AI)" sposobnih za provođenje eksperimenata i rješavanje naučnih problema. Nedavni napredak u modelima dubokog učenja revolucionirao je naučna istraživanja, ali trenutni modeli još imaju problema s tačnim oponašanjem fizičkih interakcija u stvarnom svijetu.
Modeli dubokog učenja
Međutim, tim istraživača s Univerziteta u Pekingu i Orijentalnog instituta za tehnologiju (EIT) u Kini razvio je novi okvir za obuku modela strojnog učenja temeljen na prethodnom znanju, kao što su zakoni fizike ili matematička logika, uz podatke, piše Root.nation.hr.
South China Morning Post izvještava da bi takav pristup mogao dovesti do stvaranja "pravih naučnika s umjetnom inteligencijom" koji mogu poboljšati eksperimente i riješiti naučne probleme. Modeli dubokog učenja značajno su utjecali na naučna istraživanja otkrivajući odnose u velikim skupovima podataka. Uprkos ovom napretku, trenutni modeli kao što je OpenAI's Sora suočavaju se s ograničenjima u preciznoj simulaciji određenih fizičkih interakcija u stvarnom svijetu.
Naprimjer, Sora, model pretvaranja teksta u video, stekao je veliku popularnost zahvaljujući poboljšanom, realističnom prikazu objekata. Međutim, ne može tačno modelirati osnovne interakcije, naprimjer, smjer u kojem se kreće plamen svjećica na blagdanskoj torti.
Istraživači predlažu uključivanje "prethodnog znanja", kao što su zakoni fizike ili matematičke logike, zajedno s podacima za treniranje preciznijih modela strojnog učenja.
Ugrađivanje ljudskog znanja u modele umjetne inteligencije može povećati njihovu učinkovitost i sposobnost predviđanja. Kako bi riješio ovaj problem, tim je razvio okvir za procjenu vrijednosti prethodnog znanja i određivanje njegovog utjecaja na tačnost modela. Njihov okvir ima za cilj procijeniti vrijednost znanja pomoću izvedenih pravila, uzimajući u obzir faktore kao što su količina podataka i raspon procjene. Provodeći kvantitativne eksperimente, istraživači nastoje razjasniti složen odnos između podataka i prethodnog znanja, uključujući ovisnost, sinergiju i učinke zamjene.
Ovaj model-dijagnostički sistem može se primijeniti na različite mrežne arhitekture, pružajući sveobuhvatno razumijevanje uloge prethodnog znanja u modelima dubokog učenja.
Ljudska intervencija
Istraživači su testirali svoj okvir na modelima za rješavanje višedimenzionalnih jednadžbi i predviđanje rezultata hemijskih eksperimenata. Otkrili su da je uključivanje prethodnog znanja uveliko poboljšalo izvedbu ovih modela, posebno u naučnim područjima gdje je dosljednost s fizikalnim zakonima ključna za izbjegavanje potencijalno katastrofalnih ishoda. Dugoročno, tim ima za cilj razviti modele umjetne inteligencije koji mogu samostalno identificirati i primijeniti relevantno znanje bez ljudske intervencije.
Međutim, oni priznaju da se s povećanjem količine podataka u modelu mogu pojaviti problemi kao što je dominacija općih pravila nad specifičnim lokalnim pravilima, posebno u područjima kao što su biologija i hemija, gdje opća pravila možda nedostaju.