November 3, 2025

Sumber asal: Dewan Kosmik, Jendela DBP

Bayangkan suasana di dalam sebuah bilik mesyuarat. Papan putih dipenuhi dengan lakaran algoritma dan barisan kod atur cara yang rumit. Sekumpulan jurutera perisian tekun meneliti model kecerdasan buatan atau artificial intelligence (AI) yang sedang dibangunkan. Di ruang yang dipenuhi tumpuan dan ketikan papan kekunci itu, lahir satu persoalan yang mengubah arah perbincangan.

“Bagaimanakah jika model AI ini boleh bercakap seperti orang Malaysia? Model yang faham makna ‘lah’ dalam bahasa pasar. Model yang tahu membezakan antara pakaian tradisional kaum Iban dengan kaum Bidayuh.”

Persoalan yang kelihatan ringkas itu sebenarnya telah membuka pintu kepada satu gagasan besar, iaitu untuk membangunkan model AI yang memahami bahasa, budaya dan jiwa masyarakat Malaysia. Bukan sekadar tentang mencipta teknologi baharu, hasrat tersebut adalah tentang menanamkan nilai tempatan ke dalam sistem pintar yang mampu menutur, mentafsir dan berfikir seperti rakyatnya sendiri. Setiap baris kod yang ditulis juga membawa misi untuk membentuk AI yang memahami bahasa, budaya, emosi dan kehalusan makna dalam tutur rakyat Malaysia.

Apabila ChatGPT sudah wujud, perlukah Malaysia mempunyai model AI yang tersendiri? Soalan ringkas ini akhirnya melahirkan projek besar yang dinamakan ILMU, model bahasa besar atau large language model (LLM) pertama negara.

ILMU dilancarkan pada 12 Ogos 2025 bersempena dengan Association of Southeast Asian Nations (ASEAN) AI Malaysia Summit di Kuala Lumpur. Projek ini dibangunkan oleh YTL AI Labs, anak syarikat YTL Power International Berhad dengan sokongan Kementerian Sains, Teknologi dan Inovasi serta Universiti Malaya.

Dalam proses pembinaan ILMU, data dikumpul, dialek dirakam dan ungkapan disemak dengan teliti. Hasil pembangunan tersebut melahirkan sistem AI yang berupaya berbahasa Melayu serta memahami cara rakyat Malaysia berfikir dan berinteraksi.

ILMU juga mampu berloghat Sabah, berjenaka gaya Kuala Lumpur dan berseloroh seperti orang Kedah. Selain itu, model ini mampu menjana ayat berdasarkan konteks dan emosi pengguna. Jika seseorang itu menulis mesej, “Wei, tolonglah tulis esei pasal cuaca panas, cepatlah!”, model luar mungkin memberikan jawapan yang kaku, sedangkan ILMU memahami nada gesaan dan suasana tropika penulis lalu memberikan respons dengan nada empati dan bersahaja.

Kebanyakan model antarabangsa masih terbatas dalam memahami bahasa Melayu dengan mendalam. ILMU hadir untuk mengubah keadaan tersebut dengan menjadikan bahasa kebangsaan sebagai teras utama latihannya.

Model ini dibangunkan melalui pelbagai sumber tempatan seperti berita, pantun, seloka dan catatan media sosial. Pendekatan ini membolehkan ILMU menguasai struktur, gaya dan kehalusan bahasa Melayu dengan lebih menyeluruh sehingga menjadikan model ini sebagai antara penutur digital Melayu paling fasih di dunia.

Selain menumpukan aspek bahasa, ILMU turut menegaskan kepentingan kedaulatan data negara. Semua proses pemprosesan dan penyimpanan dijalankan di pusat data hijau milik YTL Power di Malaysia yang beroperasi menggunakan tenaga boleh baharu serta mematuhi undang-undang perlindungan data tempatan. Pendekatan ini memastikan maklumat sensitif negara kekal terpelihara dan tidak melintasi sempadan digital tanah air.

Model global seperti Gemini, Claude dan Llama memiliki kelebihan dari segi keupayaan teknikal, namun masih terikat dengan bias budaya tempat asalnya. Model seperti Gemini misalnya, mampu memahami teks dalam bahasa Melayu tetapi sering gagal menangkap intonasi, emosi serta gaya pertuturan masyarakat tempatan.

Sebaliknya, ILMU dibangunkan berasaskan kepelbagaian budaya Malaysia yang merangkumi pelbagai etnik, dialek dan cara berkomunikasi. Hal ini menjadikan ILMU lebih selaras dengan realiti pengguna tempatan serta mampu memberikan respons yang lebih autentik dan berempati.

Walaupun begitu, pembangunan model bahasa nasional menuntut penelitian yang mendalam terhadap beberapa aspek seperti bias data, ketepatan fakta dan etika penggunaan AI. Tanpa kawalan yang menyeluruh, model ini berisiko mengulangi kelemahan model luar yang hanya unggul dari segi teknologi tetapi rapuh dari sudut tanggungjawab sosial, nilai budaya dan kesensitifan tempatan.

ILMU dibangunkan sebagai model multimod yang berupaya memahami dan menjana maklumat dalam pelbagai bentuk seperti teks, suara dan imej. Keupayaan ini membuka ruang penggunaan yang luas dan merentas pelbagai sektor, termasuklah analisis imej dalam bidang pertanian, penyelidikan kesihatan awam serta pembangunan chatbot bersuara yang mampu berinteraksi secara semula jadi dengan pengguna.

Dari segi kos, ILMU menawarkan alternatif yang lebih berpatutan kerana dibangunkan dengan menggunakan sumber tempatan dan disokong oleh ekosistem digital dalam negara. YTL AI Labs turut merancang pelaksanaan program pecutan AI kebangsaan yang menyediakan kredit pembangunan kepada syarikat pemula dan penyelidik tempatan bagi memperluas peluang penerokaan serta inovasi teknologi ini.

Dalam bidang pendidikan, ILMU berpotensi berfungsi sebagai tutor maya yang memahami keperluan dan gaya pembelajaran pelajar tempatan. Dalam sektor perniagaan pula, model ini dapat membantu perusahaan kecil dan sederhana untuk menghasilkan kandungan pemasaran, menterjemah dokumen serta menyediakan laporan dengan gaya yang profesional dan mudah difahami. Selain itu, agensi kerajaan juga boleh memanfaatkan ILMU bagi membangunkan sistem chatbot perkhidmatan awam yang lebih responsif, cekap dan dekat dengan bahasa masyarakat.

Pembangunan ILMU telah membuka ruang baharu kepada dunia akademik tempatan dalam bidang penyelidikan AI. Para penyelidik kini mempunyai model tempatan yang lebih sesuai untuk kajian, penilaian dan pembangunan berasaskan konteks Malaysia. Melalui ILMU, pengkaji dapat menyesuaikan eksperimen dengan realiti bahasa, budaya dan corak komunikasi masyarakat tempatan. Langkah ini secara tidak langsung memperluas kapasiti penyelidikan AI dalam kalangan tenaga akademik, pelajar dan institusi pendidikan tinggi negara.

Menurut laporan YTL AI Labs, ILMU menunjukkan prestasi yang cemerlang dalam ujian penanda aras bahasa Melayu (MMLU) apabila berjaya mengatasi model global seperti GPT-4o dan Gemini dari segi kefahaman konteks. Walaupun pencapaian tersebut menjadi bukti kemampuan teknologi tempatan, perjalanan pembangunan model ini masih panjang dan menuntut penelitian yang berterusan.

Kajian penilaian bebas juga perlu diteruskan bagi memastikan tahap ketepatan, kebolehpercayaan serta keadilan model ini sentiasa terpelihara. Hal ini dikatakan demikian kerana ILMU masih berada pada fasa awal pembangunan, ibarat anak kecil yang baru belajar bertatih dan proses kematangannya memerlukan masa, pemantauan serta bimbingan berterusan daripada pelbagai pihak.

Sebagai rumusannya, Malaysia telah melangkah ke fasa penting dalam pembangunan AI melalui penghasilan model bahasa besar tempatan. Menerusi keupayaan untuk memahami bahasa Melayu dan Indonesia, ILMU berpotensi muncul sebagai model AI serantau yang menyatukan komunikasi digital berasaskan nilai etika, bahasa dan budaya tempatan di rantau ASEAN. Keupayaan ini bukan sahaja memperkukuh kedaulatan digital negara, malah meletakkan Malaysia sebagai peneraju dalam pembangunan teknologi beridentiti serantau.

ILMU menggambarkan keberanian Malaysia dalam usaha membina identiti digital sendiri di tengah-tengah dunia yang masih dikuasai oleh gergasi teknologi luar. Langkah ini memperlihatkan keyakinan bahawa negara berupaya melangkah lebih jauh daripada sekadar menjadi pengguna teknologi.

Malaysia kini sedang menulis masa hadapan dalam bahasa kebangsaan dan memartabatkan warisan linguistik sebagai asas kemajuan digital. Kewujudan ILMU juga membuktikan kemampuan Malaysia untuk tampil sebagai pencipta AI yang berjiwa tempatan, berpaksikan nilai kemanuasiaan, kelimuan dan rasa bangga terhadap jati diri nasional.

Ts. Syahrul Nizam Junaini
Fakulti Sains Komputer dan Teknologi Maklumat
Universiti Malaysia Sarawak