×
اقتصادی
شناسه خبر : 180274
تاریخ انتشار : سه‌شنبه 1403/04/12 ساعت 14:46

نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی و ارائه تعدادی از مدل‌های زبانی توسعه یافته توسط گروه MCINext که سیستم‌های مرتبط هوش مصنوعی، در نمایشگاه الکامپ 1403 برگزار شد.

نورنیوز-گروه اقتصادی: گروه MCINext همراه اول در سومین روز برگزاری نمایشگاه بین المللی الکامپ ۱۴۰۳، ضمن رونمایی تعدادی از مدل های زبانی توسعه یافته خود شامل سیلک (با ۱.۳ میلیارد پارامتر)، آهوران (با ۸ میلیارد پارامتر) و آوا (با ۱۳ میلیارد پارامتر) را با حضور آرش امینی، سرپرست تحقیق و توسعه هوش مصنوعی MCINEXT و حامد تهمورسی، مدیر ارشد فناوری MCINEXT در سالن خلیج فارس نمایشگاه بین المللی تهران، در نشستی تخصصی کارکردها و ویژگی های هر یک از آنها را ارائه کرد.

در این نشست، علاوه بر تاکید روی توسعه محصولات مبتنی بر هوش مصنوعی، دستاوردهای این مجموعه از جمله ربات پاسخگو همراه اول و چند مدل زبانی که برای استفاده همگانی در دسترس قرار گرفته اند نیز معرفی شدند.

مدل های زبانی بزرگ (LLM)، سیستم های هوش مصنوعی هستند که با تحلیل و یادگیری از حجم زیادی از داده های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر نیز با حمایت مرکز تحقیق و توسعه همراه اول توسعه یافته اند.

در ادامه به صورت اجمالی هر یک از مدل های زبانی بزرگ گروه MCINEXT همراه اول معرفی و ارائه شدند.

*مدل زبانی سیلک (Sialk)

مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده است، با وجود تعداد پارامتر نسبتا کم، قابلیت زبانی خوبی را به نمایش می گذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.

*مدل زبانی آهوران (Ahoran)

مدل آهوران بر پایه مدل چند زبانه Llama۳ شرکت Meta و به صورت آموزش ادامه دار (continual pretraining) بر روی یک مجموعه دادگان فارسی توسعه داده شده است. با توجه به قابلیت های زیاد مدل پایه، ادامه آموزش، باعث تقویت تولید متن به زبان فارسی شده در حالیکه قابلیت های دیگر مدل تا حد زیادی حفظ شده است.

کاربردهای تجاری این مدل ها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت بات ها، تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان است. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

*مدل زبانی آوا (Ava)

مدل آوا به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere توسعه داده شده است.

بر خلاف دو مدل قبلی که جوابگوی سوالات کلی هستند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخگویی است (RAG) و تا حد امکان از ارائه اطلاعات استفاده شده در حین آموزش پرهیز می کند؛ استفاده اصلی این مدل در ربات های پاسخگوی خاص منظوره است.

علاوه بر آموزش این مدل ها، تلاش شده است تا به کمک روش های همترازسازی (RLHF و DPO) از تولید محتوای آسیب زا جلوگیری شود.

علاقه مندان می توانند از طریق نشانی https://llm.mcinext.org به این مدل های زبانی دسترسی پیدا کنند.


نورنیوز
نظرات

آگهی تبلیغاتی
آخرین اخبار
وضعیت آب و هوا امروز دوشنبه 27 مرداد 1404 + وضعیت استان‌ها
ماجرای جنجالی صدور قبوض نجومی برق در روستاها چه بود؟
اروپا نگران است؛ آیا صحنه برخورد «ترامپ» با «زلنسکی» تکرار می شود؟
شورای رقابت از قیمت گذاری خودرو حذف شد+ جزئیات
پیکر استاد محمود فرشچیان وارد اصفهان شد+ زمان مراسم
صلح بزرگ ترامپ یا امتیاز بزرگ پوتین؟
مرد گمشده پس از 7 سال در پیاده روی اربعین پیدا شد
تظاهرات یک میلیون نفری شهرک‌نشینان علیه نتانیاهو
ذخایر سوخت مایع نیروگاهی 60 درصد افزایش یافت
ولایتی: مردم ایران اجازه معامله بر سر امنیت ملی‌شان را نمی‌دهند
نورنما | انفجار در یکی از کارخانه‌های استیل آمریکا
اظهارات سرلشکر رحیم صفوی درباره احتمال وقوع جنگ جدید
مدیرعامل ایرانسل درباره افزایش 70 درصدی تعرفه اینترنت چه گفت؟
طرح اشغال کامل شهر غزه به تصویب رسید
سفارت آلمان در تهران موقتا تعطیل شد
انتظار 4 ساله برای دریافت خودروی کارخانه‌ای همچنان ادامه دارد
آتش‌سوزی گسترده در سوله هزارمتری آرد در شیراز
مکرون: فکر نمی کنم پوتین دنبال صلح باشد
انهدام گسترده پهپادهای اوکراینی بر فراز مناطق روسیه
شلیک موشک مقاومت فلسطین به قلب سرزمین‌های اشغالی
بحران آب در کشور باران‌های سیل‌آسا
تیم ملی بسکتبال ایران عنوان سوم کاپ آسیا را کسب کرد/ استرالیا قهرمان شد
آخرین جزییات از آتش‌سوزی مهیب جنوب تهران/ نمایی نزدیک از آتش‌سوزی انبار روغن موتور + فیلم
شلیک 70 موشک از یمن به اراضی اشغالی در 5 ماه
طرح توسعه شهرک سازی اسرائیل را تهدیدی برای موجودیت کشور فلسطین می‌دانیم
جوزف عون: طرح آمریکا با اصلاحات لبنان به سند ملی تبدیل شد
هوای تهران از سه‌شنبه گرم‌تر می‌شود؛ افزایش تابش اشعه فرابنفش در پایتخت
منچستر یونایتد با شکست لیگ جزیره را آغاز کرد
عکس های منتخب جهان، 17 آگوست 2025
نفتالی بنت: نتانیاهو در مقابله با حماس ناکام مانده است
رئیس‌جمهور از تلاش‌های برگزارکنندگان مراسم اربعین تقدیر کرد
انفجار تروریستی در قلب شهر حلب سوریه
قلعه‌نویی: لژیونرهای تیم در تورنمنت کافا حضور ندارند
برکناری سه مقام ارشد سعودی به دستور ملک سلمان
عارف: دولت چهاردهم به دنبال تمرکززدایی و انتقال اختیارات است
کیفیت هوا در تهران به وضعیت ناسالم درآمد
مدیر ChatGPT: کاربران باید همواره دقت پاسخ‌های هوش مصنوعی را تایید کنند
نخست‌وزیر یمن خواستار پایان یافتن بی‌تفاوتی کشورهای عربی شد
توقف ناامیدکننده چلسی در گام اول لیگ برتر
جولانی به تکفیری‌ها تابعیت سوری هدیه کرد
پوتین و ترامپ؛ بازی با روان در میدان سیاست
پزشکیان در اوراسیا؛ نقطه عطف دیپلماسی و همکاری ایران
نیویورک‌تایمز: نفوذ اطلاعاتی ایران در ساختار داخلی اسرائیل فاش شد
زنگ خطر در نظام سلامت؛ 80 درصد داروخانه‌ها در معرض ورشکستگی
روبیو هشدار داد: این جنگِ ما نیست؛ باید به‌دنبال آتش‌بس باشیم
سفر هماهنگ زلنسکی و رهبران اروپایی به آمریکا برای حمایت از اوکراین
بیانیه وزارت امور خارجه در مورد محکومیت جنایات رژیم صهیونیستی و کوچاندن اجباری ساکنان غزه
ایجاد «اتاق امن» در مدارس؛ گامی برای افزایش امنیت دانش‌آموزان
تهدید وزیر جنگ اسرائیل پس از حمله موشکی یمن به سرزمین‌های اشغالی
ویتکاف: پوتین آماده پذیرش تضمین‌های امنیتی برای اوکراین است
X
آگهی تبلیغاتی