میسترال از اولین هوش مصنوعی صوتی متنباز خود رونمایی کرد؛ با Voxtral آشنا شوید
گون آیدین: مدلهای جدید میسترال عملکردی رقابتی و قیمتی بسیار پایینتر ارائه میدهند.

گون آیدین،استارتاپ فرانسوی میسترال (Mistral) از اولین خانواده مدلهای صوتی متنباز خود با نام «Voxtral» رونمایی کرد. این مدلهای جدید با عملکردی رقابتی و قیمتی بسیار پایینتر، بهدنبال ارائه یک جایگزین قدرتمند و مقرونبهصرفه در برابر غولهایی مثل OpenAI و گوگل هستند.
قابلیتهای گفتاری هوش مصنوعی یکی از جنبههای مهم این فناوری است؛ اما تا به امروز، کسبوکارها با یک انتخاب دشوار روبهرو بودند: یا از سیستمهای متنباز رایگان با دقت پایین و درک معنایی محدود استفاده کنند، یا به سراغ APIهای بسته و اختصاصی شرکتهای بزرگ بروند که با وجود عملکرد بهتر، هزینه بسیار بالاتری دارند و کنترل کمتری را در اختیار توسعهدهنده قرار میدهند.Voxtralدقیقاً برای پر کردن این شکاف طراحی شده است. این پلتفرم، دقت و درک معنایی پیشرفته را در یک مدلمتنبازو با قیمتی که به گفته میسترال«کمتر از نصف»رقبای اصلی است، ارائه میدهد.
هوش مصنوعی صوتی Voxtral میسترال
Voxtral با تکیه بر مدل زبانی بزرگMistral Small 3.1 توسعه یافته و قابلیتهایی فراتر از تبدیل گفتار به متن ارائه میدهد؛ این مدل صوتی قادر به رونویسی فایلهای صوتی تا۳۰ دقیقهو درک محتوای آنها تا۴۰ دقیقهاست. همچنین کاربران میتوانند مستقیماً از محتوای فایل صوتی سؤال بپرسند یا خلاصههای ساختاریافته از آن دریافت کنند، بدون نیاز به استفاده از چند مدل مجزا. البته این مدل در زبانهای پرکاربردی مانند انگلیسی، اسپانیایی، فرانسوی، آلمانی، هندی و ایتالیایی عملکردی پیشرفته دارد.

میسترال این فناوری را در دو اندازه مختلف ارائه کرده است:
- Voxtral Small:یک مدل قدرتمند۲۴ میلیارد پارامتری که برای کارهای بزرگ طراحی شده و عملکردی رقابتی با مدلهایی مثل جمینای ۲.۵ فلش،GPT-4o-miniوElevenLabs Scribeدارد.
- Voxtral Mini:یک مدل سبک۳ میلیارد پارامتری که برای کاربردهای کوچکتر مناسب است.
علاوهبراین، یک نسخه فوقالعاده ارزان و بهینهسازیشده فقط برای رونویسی با نامVoxtral Mini Transcribeنیز ارائه شده که به گفته میسترال، عملکردی بهتر ازOpenAI Whisperبا کمتر از نصف قیمت دارد.
میسترال، به عنوان یکی از بزرگترین حامیان اکوسیستم متنباز، مدلهای Voxtral را برای دانلود رایگان درHugging Faceقرار داده است. همچنین، استفاده از API آن با قیمت۰.۰۰۱ دلار در دقیقهآغاز میشود و کاربران میتوانند تا چند هفته دیگر آن را در چتبات میسترال،Le Chat، نیز آزمایش کنند.
منبع: دیجیاتو