OpenAI Rilis Dua Model AI Terbuka 'gpt-oss' untuk Kinerja Canggih

OpenAI Rilis Dua Model AI Terbuka 'gpt-oss' untuk Kinerja Canggih

OpenAI Rilis Dua Model AI Terbuka 'gpt-oss' untuk Kinerja Canggih

OpenAI baru-baru ini mengumumkan peluncuran dua model AI penalaran (reasoning models) dengan bobot terbuka (open-weight) yang memiliki kemampuan serupa dengan model o-series andalannya. Kedua model ini dapat diunduh secara gratis dari platform pengembang online, Hugging Face. Perusahaan mengklaim model ini sebagai "terdepan di industri" saat diukur dengan berbagai tolok ukur yang digunakan untuk membandingkan model terbuka lainnya.

Peluncuran ini menandai model bahasa 'terbuka' pertama OpenAI sejak GPT-2, yang dirilis lebih dari lima tahun lalu. Langkah ini menunjukkan pergeseran strategi di tengah meningkatnya persaingan dari pesaing global.

Fitur dan Ukuran Model AI gpt-oss

Dua model yang dirilis hadir dalam ukuran yang berbeda untuk memenuhi berbagai kebutuhan pengembang:

{getToc} $title={Table of Contents}

gpt-oss-120b: Model yang lebih besar dan lebih mumpuni. Dapat dijalankan pada satu GPU Nvidia.

gpt-oss-20b: Model yang lebih ringan dan efisien. Dapat dijalankan bahkan di laptop konsumen dengan memori 16GB.

OpenAI menjelaskan bahwa model terbukanya mampu mengirimkan permintaan yang kompleks ke model AI berbasis cloud. Ini berarti jika model terbuka tidak mampu menyelesaikan tugas tertentu (misalnya memproses gambar), pengembang dapat menghubungkan model tersebut ke salah satu model tertutup OpenAI yang lebih canggih.

Performa Gpt-oss Dibanding Model Lain

OpenAI menargetkan model terbukanya menjadi pemimpin di antara model AI bobot terbuka lainnya, dan mereka mengklaim berhasil mencapainya.


Codeforces (dengan tools): Pada tes coding kompetitif ini, gpt-oss-120b dan gpt-oss-20b mencetak skor 2622 dan 2516. Keduanya mengungguli DeepSeek R1, namun masih di bawah o3 dan o4-mini.

Humanity’s Last Exam (HLE): Pada tes yang menantang ini, gpt-oss-120b dan gpt-oss-20b mencetak skor 19% dan 17.3%. Skor ini di bawah o3, tetapi mengungguli model terbuka terkemuka dari DeepSeek dan Qwen.

Meskipun demikian, model terbuka ini diketahui mengalami halusinasi secara signifikan lebih banyak dibandingkan model penalaran AI terbaru OpenAI, yaitu o3 dan o4-mini. Halusinasi, atau kesalahan informasi yang dibuat-buat, terjadi pada 49% dan 53% pertanyaan pada PersonQA, tolok ukur internal OpenAI untuk mengukur akurasi pengetahuan tentang orang.

Proses Pelatihan dan Teknologi di Balik Gpt-oss

OpenAI menyatakan bahwa model terbukanya dilatih dengan proses yang mirip dengan model berpemiliknya. Setiap model memanfaatkan teknologi mixture-of-experts (MoE) untuk mengaktifkan parameter yang lebih sedikit per pertanyaan, sehingga berjalan lebih efisien. Misalnya, gpt-oss-120b dengan 117 miliar total parameter hanya mengaktifkan 5.1 miliar parameter per token.

Model ini juga dilatih menggunakan reinforcement learning (RL), sebuah proses pasca-pelatihan untuk mengajari model AI mana yang benar dan salah. Proses ini membuat model gpt-oss mampu mengaktifkan tools seperti pencarian web atau eksekusi kode Python sebagai bagian dari proses penalaran mereka. Namun, model terbuka ini hanya mendukung teks, dan tidak dapat memproses atau menghasilkan gambar dan audio.

Lisensi dan Kebijakan Data Gpt-oss

OpenAI merilis gpt-oss-120b dan gpt-oss-20b di bawah lisensi Apache 2.0, salah satu lisensi yang paling permisif. Ini memungkinkan perusahaan untuk memonetisasi model terbuka OpenAI tanpa perlu membayar atau mendapatkan izin.

Namun, tidak seperti penawaran open source penuh dari lab AI lain, OpenAI tidak merilis data pelatihan yang digunakan untuk membuat model-model ini. Keputusan ini diambil di tengah banyaknya gugatan yang menuduh penyedia model AI melatih model mereka secara tidak tepat menggunakan karya berhak cipta.

Fokus pada Keamanan dan Manfaat

CEO Sam Altman menyatakan bahwa misi OpenAI adalah memastikan AGI (Kecerdasan Buatan Umum) yang bermanfaat bagi seluruh umat manusia. Dengan merilis model gpt-oss, OpenAI berharap dapat mempromosikan adopsi AI yang sejalan dengan nilai-nilai Barat.

Sebelum dirilis, OpenAI menunda peluncuran untuk mengatasi masalah keamanan. Setelah pengujian, mereka menemukan bahwa gpt-oss mungkin sedikit meningkatkan kemampuan terkait biologi, tetapi tidak mencapai ambang batas "kemampuan tinggi" yang berbahaya, bahkan setelah penyesuaian (fine-tuning).

Meskipun model gpt-oss tampak sebagai yang terdepan di antara model terbuka saat ini, para pengembang kini menantikan rilis DeepSeek R2 dan model terbuka baru dari Superintelligence Lab milik Meta.

Posting Komentar

Lebih baru Lebih lama