Mesterséges intelligencia teszt

Az AI (a mesterséges intelligencia) mindenre válaszol Neked. Méghozzá nagy-nagy magabiztossággal! De tudnod kell, hogy a válasza nem mindig jó. Magáról is azt állítja, hogy "természetesen tévedhetek".

Ha akarod, megoldja a matematika feladataidat is :) Hogy jól oldja-e meg, és lehet-e bízni a megoldásában? Erre a kérdésre kerestük a választ

Három mesterséges intelligenciát teszteltünk matekból

Ebben a cikkben a 2022. november 30-án indult ChatGPT , a 2023. február 1-jén indult ChatGPT Plus (fizetős) verziójának, és a 2023. március 14-én indult Bing AI chatbot -nak (ami a Bing keresőbe épített mesterséges intelligencia) a korlátait vizsgáljuk a matematikai feladatmegoldásban.

mesterséges intelligencia matekot tanul
A Bing AI így képzeli el a mesterséges intelligenciát matekozás közben 😁

Mesterséges intelligencia vs. egyszerű geometria feladat

Egy testnek 12 éle és 8 csúcsa van. Milyen testre gondolhatunk?

X ChatGPT válasza: Az oktaéder egy olyan platonikus test, amelynek nyolc egyenlő háromszög alakú oldala és 12 éle van. - rossz a megoldás.

Az oktaédernek csak 6 csúcsa van!

✓ X ChatGPT Plus válasza: A leírt jellemzők alapján a test, amire gondolhatsz, a kocka. A kockának 12 éle és 8 csúcsa van. (Igen, gondolhatunk kockára, de másra is! ) - hiányos a megoldás.

✓ X Bing AI válasza: A test, amire gondolhatunk, egy téglatest. A téglatestnek 8 csúcsa és 12 éle van. (Igen, gondolhatunk a téglatestre, de másra is! ) - hiányos a megoldás.

paralelepipedon

hatszög alapú "dupla"gúla 8 csúccsal és 12 éllel
A paralelepipedon (felső kép) is egy ilyen test, és még rengeteg másféle is lehet.

A Bing AI adott olyan választ, ami a legbővebb halmaz, de még mindig nem a tejes megoldás. A ChatGPT Plus válasza sem rossz, mert a kocka is egy speciális téglatest, gondolhattunk akár arra is, de másra is. A ChatGPT oktaéder válasza teljesen rossz.

Egy ilyen egyszerű geometria kérdésnél belefutottunk az AI egyik legnagyobb hibájába: magabiztosan választ ad, ám az lehet hibás vagy hiányos is.

A kérdés után arra kértük a chatbotokat, hogy rajzoljanak nekünk kocka testhálókat. Ezt egyikük sem tudta teljesíteni, de a ChatGPT Plus megfelelően leírta a módszert, hogy hogyan tudjuk lerajzolni magunknak.

(A Testek; a kocka és a téglatest Matek Oázis tananyagban interaktívan tanulhatsz meg mindent a téglatestekről, és garantáltan igazat mondunk 😀 )

Mesterséges intelligencia vs. egyszerű szöveges feladat

Hány éves most az az ember, aki 16 év múlva ötször annyi idős lesz, mint amennyi 8 évvel ezelőtt volt?

✓ ChatGPT: 14.

✓ ChatGPT Plus: 14.

X Bing AI: 24.

Mindhárom chatbot jól értelmezte a kérdést, és mindhárom felírt egy egyenletet a feladat szövege alapján. Azonban az egyenletmegoldás során a Bing AI nem tudta megfelelően felbontani a zárójelet, így rossz eredményt kapott.

A chatbot, ami a geometriai feladatra a legjobb választ adta, látványosan rossz eredményt adott. Amikor felhívtuk rá a figyelmét, hogy hol hibázott, akkor újraszámolta:

mesterséges intelligencia szöveges feladatot old meg
Az eredmény még rosszabb lett...

Mesterséges intelligencia vs. nehezebb szöveges feladat (felvételi feladat)

Ebéd előtt megittuk egy kancsó víz $2 over 9$ – ed részét. Ebéd közben ittunk 4 decilitert, és azt vettük észre, hogy a kancsó $2 over 3$ része üres. Hány deciliteres a kancsó?

✓ ChatGPT: 9 dl.

X ChatGPT Plus: 1,2 dl.

✓ Bing AI: 9 dl.

Elsőre a Bing AI látványosan elbukott: egy weboldalon talált egy 1 literes kancsót, ezért magabiztosan bemutatta, hogy a kancsó 1 liter. Miután felhívtuk rá a figyelmét, hogy ez azért nem így van, akkor újraszámolta a feladatot. Most sikeres volt a zárójelfelbontás az egyenletmegoldás során, így végül megadta a helyes választ. A fizetős ChatGPT teljesen rossz irányba indult el.

Inkább tanuld meg a Matek Oázisban Hosszú szövegezésű vagy bonyolult érettségi feladatok megoldását, mint az AI-tól 😇

Mesterséges intelligencia vs. 6. osztályos felvételi

A 2023-as felvételi 8. feladata:

Két kosárban almák és körték vannak. A két kosárban ugyanannyi darab gyümölcs van. Az első kosárban háromszor annyi alma van, mint körte. A második kosárban ugyanannyi alma van, mint körte. A két kosárban összesen 24 darab körte van.
a) Az első kosárban lévő gyümölcsök hányadrésze alma?
b) Hány körte van az első kosárban?
c) Hány alma van a második kosárban?
d) Hány darab gyümölcs van a két kosárban összesen?
e) Az összes gyümölcsnek hányadrésze körte?

ChatGPT: a) X b) X c) X d) X e) X

ChatGPT Plus: a) ✓ b) X c) X d) X e) X

Bing AI: a) ✓ b) X c) X d) X e) X

Egyértelműen elértük a mesterséges intelligencia korlátait, ami a matekozást illeti. A chatbotok teljesen rossz gondolatokat írnak, magabiztosan, rosszul levezetve. Összetett feladatok értelmezésére egyértelműen nem ajánljuk.

Te is használd a Matek Oázis Felvételi felkészítő tréningjét és a matek akadály helyett lehetőség lesz!

mesterséges intelligencia matekfeladatot vezet le
A matek a mesterséges intelligenciának is fejtörést okoz!

Mesterséges intelligencia vs. Nemzetközi Kenguru Matematikaverseny

Anna és Berci egy olyan kártyacsomaggal játszottak, amelyiknek a lapjait 1-től 100-ig megszámozták. Elsőként Anna kiválogatta a csomagból azokat a lapokat, amelyeken szereplő számok oszthatók voltak 7-tel vagy tartalmaztak 7-es számjegyet. Másodikként Berci a maradék lapok közül azokat válogatta ki, amelyek oszthatók voltak 5-tel vagy tartalmaztak 5-ös számjegyet. Hány lap jutott Bercinek?

X ChatGPT: 77 db.

X ChatGPT Plus: 18 db, 20 db,

X Bing AI: 19 db

A helyes válasz 23. Egyértelműen látszik, hogy a nehezebb szövegezésű feladatokba beletörik az AI virtuális bicskája. Teljesen téves következtetéseket vontak le az adott információkból, ismét magabiztosan levezették (ellentmondásokkal teletűzdelve) a rossz megoldásaikat.

A ChatGPT Plus elsőre rosszul számolta ki, ezért megkértük, hogy számolja újra. Elnézést kért, és kiszámolta, hogy 20 a megoldás. Sajnos ekkor is rossz következtetésekből kapott rossz eredményt.

Az AI alkalmazása a matematikai feladatok megoldásában - Tanulságok

Az AI alkalmazása a matematikai feladatok megoldásában egyre népszerűbb. Az AI néha képes megoldani az egyetemi szintű matematikai problémákat is. Azonban, ahogy láttuk, nem mindig megbízható a feladatok megoldásában. Legnagyobb hibája, hogy magabiztosan adja elő a rossz válaszait.

Volt még egy érdekes tapasztalatunk. Az egyik feladatot jól kiszámolta a program (ChatGPT Plus és a Bing AI is). Ezután megkérdőjeleztük, hogy jó-e a megoldás. Mindkét AI elnézést kért, és kiszámolta máshogy, rosszul(!) a feladatot.

Ha tehát a matematikában szeretnél magabiztosabbá válni, nem érdemes az AI-tól tanulnod (bármennyire magabiztos). A magabiztosságot a Matek Oázis tananyagai is megadják Neked, és a válaszaid is jók lesznek, nem úgy, mint az AI válaszai 😉

Készülj Te is a Matek Oázis interaktív tananyagaival! A saját megoldásaid sokkal biztosabbak lesznek, mint az AI megoldásai!