فناوری 1404/04/25 19:43:53 | کد خبر: 14929

میسترال از اولین هوش مصنوعی صوتی متن‌باز خود رونمایی کرد؛ با Voxtral آشنا شوید

گون آیدین: مدل‌های جدید میسترال عملکردی رقابتی و قیمتی بسیار پایین‌تر ارائه می‌دهند.

گون آیدین،استارتاپ فرانسوی میسترال (Mistral) از اولین خانواده مدل‌های صوتی متن‌باز خود با نام «Voxtral» رونمایی کرد. این مدل‌های جدید با عملکردی رقابتی و قیمتی بسیار پایین‌تر، به‌دنبال ارائه یک جایگزین قدرتمند و مقرون‌به‌صرفه در برابر غول‌هایی مثل OpenAI و گوگل هستند.

قابلیت‌های گفتاری هوش مصنوعی یکی از جنبه‌های مهم این فناوری است؛ اما تا به امروز، کسب‌وکارها با یک انتخاب دشوار روبه‌رو بودند: یا از سیستم‌های متن‌باز رایگان با دقت پایین و درک معنایی محدود استفاده کنند، یا به سراغ APIهای بسته و اختصاصی شرکت‌های بزرگ بروند که با وجود عملکرد بهتر، هزینه بسیار بالاتری دارند و کنترل کمتری را در اختیار توسعه‌دهنده قرار می‌دهند.Voxtralدقیقاً برای پر کردن این شکاف طراحی شده است. این پلتفرم، دقت و درک معنایی پیشرفته را در یک مدلمتن‌بازو با قیمتی که به گفته میسترال«کمتر از نصف»رقبای اصلی است، ارائه می‌دهد.

هوش مصنوعی صوتی Voxtral میسترال

Voxtral با تکیه بر مدل زبانی بزرگMistral Small 3.1 توسعه یافته و قابلیت‌هایی فراتر از تبدیل گفتار به متن ارائه می‌دهد؛ این مدل صوتی قادر به رونویسی فایل‌های صوتی تا۳۰ دقیقهو درک محتوای آنها تا۴۰ دقیقهاست. همچنین کاربران می‌توانند مستقیماً از محتوای فایل صوتی سؤال بپرسند یا خلاصه‌های ساختاریافته از آن دریافت کنند، بدون نیاز به استفاده از چند مدل مجزا. البته این مدل در زبان‌های پرکاربردی مانند انگلیسی، اسپانیایی، فرانسوی، آلمانی، هندی و ایتالیایی عملکردی پیشرفته دارد.

میسترال این فناوری را در دو اندازه مختلف ارائه کرده است:

  1. Voxtral Small:یک مدل قدرتمند۲۴ میلیارد پارامتری که برای کارهای بزرگ طراحی شده و عملکردی رقابتی با مدل‌هایی مثل جمینای ۲.۵ فلش،GPT-4o-miniوElevenLabs Scribeدارد.
  2. Voxtral Mini:یک مدل سبک۳ میلیارد پارامتری که برای کاربردهای کوچک‌تر مناسب است.

علاوه‌براین، یک نسخه فوق‌العاده ارزان و بهینه‌سازی‌شده فقط برای رونویسی با نامVoxtral Mini Transcribeنیز ارائه شده که به گفته میسترال، عملکردی بهتر ازOpenAI Whisperبا کمتر از نصف قیمت دارد.

میسترال، به عنوان یکی از بزرگ‌ترین حامیان اکوسیستم متن‌باز، مدل‌های Voxtral را برای دانلود رایگان درHugging Faceقرار داده است. همچنین، استفاده از API آن با قیمت۰.۰۰۱ دلار در دقیقهآغاز می‌شود و کاربران می‌توانند تا چند هفته دیگر آن را در چت‌بات میسترال،Le Chat، نیز آزمایش کنند.

منبع: دیجیاتو

avatar
سلام

پایگاه خبری گون آیدین

مشاهده اخبار