Ebben a cikkben a 2022. november 30-án indult ChatGPT , a 2023. február 1-jén indult ChatGPT Plus (fizetős) verziójának, és a 2023. március 14-én indult Bing AI chatbot -nak (ami a Bing keresőbe épített mesterséges intelligencia) a korlátait vizsgáljuk a matematikai feladatmegoldásban.
A Bing AI így képzeli el a mesterséges intelligenciát matekozás közben 😁
Egy testnek 12 éle és 8 csúcsa van. Milyen testre gondolhatunk?
X ChatGPT válasza: Az oktaéder egy olyan platonikus test, amelynek nyolc egyenlő háromszög alakú oldala és 12 éle van. - rossz a megoldás.
Az oktaédernek csak 6 csúcsa van!
✓ X ChatGPT Plus válasza: A leírt jellemzők alapján a test, amire gondolhatsz, a kocka. A kockának 12 éle és 8 csúcsa van. (Igen, gondolhatunk kockára, de másra is! ) - hiányos a megoldás.
✓ X Bing AI válasza: A test, amire gondolhatunk, egy téglatest. A téglatestnek 8 csúcsa és 12 éle van. (Igen, gondolhatunk a téglatestre, de másra is! ) - hiányos a megoldás.
A paralelepipedon (felső kép) is egy ilyen test, és még rengeteg másféle is lehet.
A Bing AI adott olyan választ, ami a legbővebb halmaz, de még mindig nem a tejes megoldás. A ChatGPT Plus válasza sem rossz, mert a kocka is egy speciális téglatest, gondolhattunk akár arra is, de másra is. A ChatGPT oktaéder válasza teljesen rossz.
Egy ilyen egyszerű geometria kérdésnél belefutottunk az AI egyik legnagyobb hibájába: magabiztosan választ ad, ám az lehet hibás vagy hiányos is.
A kérdés után arra kértük a chatbotokat, hogy rajzoljanak nekünk kocka testhálókat. Ezt egyikük sem tudta teljesíteni, de a ChatGPT Plus megfelelően leírta a módszert, hogy hogyan tudjuk lerajzolni magunknak.
(A Testek; a kocka és a téglatest Matek Oázis tananyagban interaktívan tanulhatsz meg mindent a téglatestekről, és garantáltan igazat mondunk 😀 )
Hány éves most az az ember, aki 16 év múlva ötször annyi idős lesz, mint amennyi 8 évvel ezelőtt volt?
✓ ChatGPT: 14.
✓ ChatGPT Plus: 14.
X Bing AI: 24.
Mindhárom chatbot jól értelmezte a kérdést, és mindhárom felírt egy egyenletet a feladat szövege alapján. Azonban az egyenletmegoldás során a Bing AI nem tudta megfelelően felbontani a zárójelet, így rossz eredményt kapott.
A chatbot, ami a geometriai feladatra a legjobb választ adta, látványosan rossz eredményt adott. Amikor felhívtuk rá a figyelmét, hogy hol hibázott, akkor újraszámolta:
Az eredmény még rosszabb lett...
Ebéd előtt megittuk egy kancsó víz – ed részét. Ebéd közben ittunk 4 decilitert, és azt vettük észre, hogy a kancsó része üres. Hány deciliteres a kancsó?
✓ ChatGPT: 9 dl.
X ChatGPT Plus: 1,2 dl.
✓ Bing AI: 9 dl.
Elsőre a Bing AI látványosan elbukott: egy weboldalon talált egy 1 literes kancsót, ezért magabiztosan bemutatta, hogy a kancsó 1 liter. Miután felhívtuk rá a figyelmét, hogy ez azért nem így van, akkor újraszámolta a feladatot. Most sikeres volt a zárójelfelbontás az egyenletmegoldás során, így végül megadta a helyes választ. A fizetős ChatGPT teljesen rossz irányba indult el.
Inkább tanuld meg a Matek Oázisban Hosszú szövegezésű vagy bonyolult érettségi feladatok megoldását, mint az AI-tól 😇
A 2023-as felvételi 8. feladata:
Két kosárban almák és körték vannak. A két kosárban ugyanannyi darab gyümölcs van. Az első kosárban háromszor annyi alma van, mint körte. A második kosárban ugyanannyi alma van, mint körte. A két kosárban összesen 24 darab körte van.
a) Az első kosárban lévő gyümölcsök hányadrésze alma?
b) Hány körte van az első kosárban?
c) Hány alma van a második kosárban?
d) Hány darab gyümölcs van a két kosárban összesen?
e) Az összes gyümölcsnek hányadrésze körte?
ChatGPT: a) X b) X c) X d) X e) X
ChatGPT Plus: a) ✓ b) X c) X d) X e) X
Bing AI: a) ✓ b) X c) X d) X e) X
Egyértelműen elértük a mesterséges intelligencia korlátait, ami a matekozást illeti. A chatbotok teljesen rossz gondolatokat írnak, magabiztosan, rosszul levezetve. Összetett feladatok értelmezésére egyértelműen nem ajánljuk.
Te is használd a Matek Oázis Felvételi felkészítő tréningjét és a matek akadály helyett lehetőség lesz!
A matek a mesterséges intelligenciának is fejtörést okoz!
Anna és Berci egy olyan kártyacsomaggal játszottak, amelyiknek a lapjait 1-től 100-ig megszámozták. Elsőként Anna kiválogatta a csomagból azokat a lapokat, amelyeken szereplő számok oszthatók voltak 7-tel vagy tartalmaztak 7-es számjegyet. Másodikként Berci a maradék lapok közül azokat válogatta ki, amelyek oszthatók voltak 5-tel vagy tartalmaztak 5-ös számjegyet. Hány lap jutott Bercinek?
X ChatGPT: 77 db.
X ChatGPT Plus: 18 db, 20 db,
X Bing AI: 19 db
A helyes válasz 23. Egyértelműen látszik, hogy a nehezebb szövegezésű feladatokba beletörik az AI virtuális bicskája. Teljesen téves következtetéseket vontak le az adott információkból, ismét magabiztosan levezették (ellentmondásokkal teletűzdelve) a rossz megoldásaikat.
A ChatGPT Plus elsőre rosszul számolta ki, ezért megkértük, hogy számolja újra. Elnézést kért, és kiszámolta, hogy 20 a megoldás. Sajnos ekkor is rossz következtetésekből kapott rossz eredményt.
Az AI alkalmazása a matematikai feladatok megoldásában egyre népszerűbb. Az AI néha képes megoldani az egyetemi szintű matematikai problémákat is. Azonban, ahogy láttuk, nem mindig megbízható a feladatok megoldásában. Legnagyobb hibája, hogy magabiztosan adja elő a rossz válaszait.
Volt még egy érdekes tapasztalatunk. Az egyik feladatot jól kiszámolta a program (ChatGPT Plus és a Bing AI is). Ezután megkérdőjeleztük, hogy jó-e a megoldás. Mindkét AI elnézést kért, és kiszámolta máshogy, rosszul(!) a feladatot.
Ha tehát a matematikában szeretnél magabiztosabbá válni, nem érdemes az AI-tól tanulnod (bármennyire magabiztos). A magabiztosságot a Matek Oázis tananyagai is megadják Neked, és a válaszaid is jók lesznek, nem úgy, mint az AI válaszai 😉
A saját megoldásaid sokkal biztosabbak lesznek, mint az AI megoldásai!
Ha érdekel a téma, olvasd el a másik AI-ról írt cikkünket is!
380 ingyenes tananyag!
...és még a kedvét sem rontja el a matek :)