Mistral meluncurkan model AI multi-modal pertamanya yang disebut Pixtral 12B

Startup kecerdasan buatan Perancis, Mistral, telah merilis model multimodal pertamanya yang disebut Pixtral 12B, bersaing dengan OpenAI dan Anthropic. Model dengan 12 miliar parameter mampu memproses gambar dan teks dan menggunakan model Nemo 12B yang ada.

Pixtral 12B diharapkan dapat diintegrasikan ke dalam chatbot perusahaan Le Chat dan platform API La Platforme, menurut kepala hubungan pengembang.

Model ini dikatakan memiliki ruang penyimpanan 24GB dan secara teoritis mampu menangani tugas-tugas seperti menulis gambar dan menghitung jumlah objek dalam sebuah foto. Akun resmi Mistral on X adalah model AI di a pos dengan berbagi ikatan magnetiknya.

Kinerja dan ketersediaan Pixtral 12B

Pixtral 12B tersedia untuk diunduh, dikonfigurasi, dan digunakan di bawah Lisensi Apache 2.0 tanpa batasan. Itu dapat diperoleh melalui tautan di GitHub dan platform pengembangan AI dan pembelajaran mesin, Hugging Face.

Seorang pengguna Reddit telah membagikan skor benchmark untuk Pixtral 12B, yang menunjukkan bahwa model bahasa tersebut mengungguli Claude-3 Haiku dan Phi-3 Vision dalam kemampuan multimodal dalam perbandingan ChartQA. Dikatakan juga mengungguli model AI yang bersaing dalam pengetahuan dan penalaran multimodal pada benchmark Massive Multitask Language Understanding (MMLU).

Hasil benchmark Pixtral
olehu/kristaller486 di dalamLokalLLaMA

Perusahaan yang didukung Amazon ini sudah terkenal dengan Codestral, model bahasa besar yang membantu pengembang membuat kode, serta Mistral Large. ReadWrite melaporkan LLM baru pada bulan Februari, menggambarkannya sebagai “model pembuatan teks tingkat lanjut” dengan “kemampuan penalaran yang unggul.”

Sebagian besar model penghasil AI, seperti Mistral, menggunakan data publik dalam jumlah besar dari web, dan sering kali tunduk pada hak cipta. Meskipun beberapa penyedia model ini mengklaim bahwa “penggunaan wajar” memungkinkan mereka mengumpulkan data publik apa pun, banyak pemegang hak cipta yang menolak praktik ini. Akibatnya, perusahaan AI seperti OpenAI dan Midjourney menghadapi tuntutan hukum yang bertujuan menghentikan hal ini terjadi.

Pada bulan Desember, startup open-source ini menerima pendanaan sebesar $414 juta dan menutup jendela investasi senilai $2 miliar. Pada bulan Mei, perusahaan yang berbasis di Paris ini berhasil menyelesaikan putaran pendanaan senilai $645 juta yang dipimpin oleh General Catalyst, yang memberi nilai perusahaan sebesar $6 miliar.

Gambar unggulan: Canva

Pos Mistral meluncurkan model AI multimodal pertamanya yang disebut Pixtral 12B muncul pertama kali di ReadWrite.



Sumber