ChatGPT анхдагч математик баталгаа гаргаж чаддаг болохыг судалгаа харууллаа
ChatGPT анхдагч математик баталгаа гаргаж чаддаг болохыг судалгаа харууллаа

Брюсселийн Врие Их Сургуулийн (VUB - Vrije Universiteit Brussel) Өгөгдлийн шинжилгээний лаборатори судалгааны шинэ судалгааны үр дүнгээ нийтэлж, арилжааны зориулалттай хэлний загварууд нь анхдагч математик баталгаа боловсруулах боломжтойг харуулжээ. Судлаачид arXiv урьдчилсан хэвлэлийн санд байршуулсан өгүүлэлдээ OpenAI-ийн хэлний үлэмж загвар (LLM - Large Language Model) болох ChatGPT-5.2 (Thinking) нь математик асуудлыг бие даан шийдвэрлэж чадсан болохыг үзүүлсэн байна.

Таамаглал ба баталгааг тайлбарлах нь
Энэхүү судалгаанд 2024 онд математикч Ран (Ran) болон Тэнг (Teng) нарын дэвшүүлсэн таамаглалыг батлах асуудал хөндөгдсөн байна. Таамаглал гэдэг нь олон жишээ, нотолгооны шинж тэмдэг дээр үндэслэн үнэн гэж үздэг боловч албан ёсны баталгаа хараахан байхгүй мэдэгдэл юм.
Математикчид ихэвчлэн давтагддаг хэв шинж илрүүлэх эсвэл тооцооллууд үргэлж ижил үр дүн өгч байгааг ажигласны дараа ийм таамаглал дэвшүүлдэг. Харин хэн нэгэн баттай нотолгоо гаргаж ирэх хүртэл энэ нь таамаглал хэвээр үлддэг бөгөөд батлагдмагц теорем болдог.

Судалгааны явц
Судалгаанд ChatGPT-тэй хийсэн долоон удаагийн чат болон баталгааны дөрвөн хувилбарын үр дүнг нэгтгэн эцсийн баталгааг гаргажээ. Баталгааг олоход ChatGPT онцгой үүрэг гүйцэтгэсэн бол мэргэжилтнүүд зөв эсэхийг шалгах, логикийн хувьд бүрэн гүйцэд болгоход чухал үүрэгтэй байжээ.

Хиймэл оюун ямар үүрэг гүйцэтгэсэн бэ?
Судлаачдын үзүүлснээр ChatGPT-5.2(Thinking) нь баталгааны бүтцийг ихэнхдээ өөрөө боловсруулсан бөгөөд хүний оролцоо маш бага байсан байна. Товч тайлбарт дурдсанаар: Өгөгдлийн шинжилгээний лабораторийн хувьд бид арилжааны зориулалттай хэлний үлэмж загвар нь анхдагч математик баталгааг бие даан боловсруулах боломжтойг харуулсан анхдагч судалгаануудын нэг юм.”
Судалгааны багийн гишүүн, постдоктор судлаач Брехт Вербекен (Brecht Verbeken): “Би ChatGPT шийдэгдээгүй математик асуудлуудыг батлахад тусална гэж эртнээс таамаглаж байсан. Гэхдээ ингэж үр дүнтэй ажиллана гэж бодоогүй” гэжээ.

“Vibe-proving” ба ирээдүйн чиг хандлага
Судлаачид энэ ажлаа “vibe-proving” хэмээх шинэ хандлагын хүрээнд тайлбарласан. Энэ нь хэлний загваруудыг ашиглан өндөр түвшний онолын сэтгэлгээг судлах, бүтэцжүүлэх арга юм. Тэдний тавьж буй гол асуулт бол энэ арга нь хиймэл оюун ашигласан программчлал (vibe-coding)-ын адил хурдтай хөгжиж, энгийн туслах хэрэгсэл байснаас бараг бие даасан шийдэл гаргагч систем болон хувирах уу гэдэг юм.
Профессор Винсент Жинис (Vincent Ginis): “Хүмүүс хиймэл оюуны бүтээлч байдал зөвхөн сургалтын өгөгдлийг дахин найруулах хэмжээнд хязгаарлагддаг гэж боддог. Манай судалгаа энэ ойлголтыг няцааж байгаад баяртай байна” гэж хэлжээ.

Хүний оролцооны ач холбогдол
Хэдийгээр загвар баталгааны ихэнх хэсгийг өөрөө гаргасан ч эцсийн баталгаажуулалт, логикийн алдааг засахад хүний оролцоо зайлшгүй шаардлагатай хэвээр байна. Энэ үйл явц нь хэлний үлэмж загварын мэргэжилтнүүд загварууд хаана бодитой хувь нэмэр оруулж чаддаг, мөн хаана хүнээр шалгах “саад” байсаар байгааг тодорхой харуулж байна.
Энэхүү хөгжүүлэлт нь хиймэл оюуныг онолын судалгаанд ашиглахад чухал үе шат болж байна. Хиймэл оюун нь зөвхөн программчлал, текст боловсруулах хэрэгсэл биш, харин хүний хяналт, шүүмжлэлт сэтгэлгээтэй хосолсноор анхдагч математик нээлтэд хувь нэмэр оруулах боломжтой болжээ. Профессор Андрес Алгаба (Andres Algaba): “Боломжит баталгаануудыг гаргах үйл явц хурдсаж байна. Харин дараагийн гол бэрхшээл нь баталгаажуулалт юм. Гэхдээ хэлний загварууд энэ тал дээр ч тусална” гэж дүгнэжээ.


Эх сурвалж: https://phys.org/news/2026-03-chatgpt-mathematical-proofs.html

Мэдээ бэлтгэсэн: Ж.Даваажаргал

 


Бусад мэдээлэл