×
اقتصادی
شناسه خبر : 180274
تاریخ انتشار : سه‌شنبه 1403/04/12 ساعت 14:46
نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی و ارائه تعدادی از مدل‌های زبانی توسعه یافته توسط گروه MCINext که سیستم‌های مرتبط هوش مصنوعی، در نمایشگاه الکامپ 1403 برگزار شد.

نورنیوز-گروه اقتصادی: گروه MCINext همراه اول در سومین روز برگزاری نمایشگاه بین المللی الکامپ ۱۴۰۳، ضمن رونمایی تعدادی از مدل های زبانی توسعه یافته خود شامل سیلک (با ۱.۳ میلیارد پارامتر)، آهوران (با ۸ میلیارد پارامتر) و آوا (با ۱۳ میلیارد پارامتر) را با حضور آرش امینی، سرپرست تحقیق و توسعه هوش مصنوعی MCINEXT و حامد تهمورسی، مدیر ارشد فناوری MCINEXT در سالن خلیج فارس نمایشگاه بین المللی تهران، در نشستی تخصصی کارکردها و ویژگی های هر یک از آنها را ارائه کرد.

در این نشست، علاوه بر تاکید روی توسعه محصولات مبتنی بر هوش مصنوعی، دستاوردهای این مجموعه از جمله ربات پاسخگو همراه اول و چند مدل زبانی که برای استفاده همگانی در دسترس قرار گرفته اند نیز معرفی شدند.

مدل های زبانی بزرگ (LLM)، سیستم های هوش مصنوعی هستند که با تحلیل و یادگیری از حجم زیادی از داده های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر نیز با حمایت مرکز تحقیق و توسعه همراه اول توسعه یافته اند.

در ادامه به صورت اجمالی هر یک از مدل های زبانی بزرگ گروه MCINEXT همراه اول معرفی و ارائه شدند.

*مدل زبانی سیلک (Sialk)

مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده است، با وجود تعداد پارامتر نسبتا کم، قابلیت زبانی خوبی را به نمایش می گذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.

*مدل زبانی آهوران (Ahoran)

مدل آهوران بر پایه مدل چند زبانه Llama۳ شرکت Meta و به صورت آموزش ادامه دار (continual pretraining) بر روی یک مجموعه دادگان فارسی توسعه داده شده است. با توجه به قابلیت های زیاد مدل پایه، ادامه آموزش، باعث تقویت تولید متن به زبان فارسی شده در حالیکه قابلیت های دیگر مدل تا حد زیادی حفظ شده است.

کاربردهای تجاری این مدل ها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت بات ها، تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان است. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

*مدل زبانی آوا (Ava)

مدل آوا به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere توسعه داده شده است.

بر خلاف دو مدل قبلی که جوابگوی سوالات کلی هستند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخگویی است (RAG) و تا حد امکان از ارائه اطلاعات استفاده شده در حین آموزش پرهیز می کند؛ استفاده اصلی این مدل در ربات های پاسخگوی خاص منظوره است.

علاوه بر آموزش این مدل ها، تلاش شده است تا به کمک روش های همترازسازی (RLHF و DPO) از تولید محتوای آسیب زا جلوگیری شود.

علاقه مندان می توانند از طریق نشانی https://llm.mcinext.org به این مدل های زبانی دسترسی پیدا کنند.


نورنیوز
نظرات

آخرین اخبار
قیمت دلار و سایر ارزها امروز سه شنبه 29 اردیبهشت ؛ بازگشت به کانال 170 هزار تومانی+ جدول
افشاگری رسانه عبری از دیگر سفرهای محرمانه نتانیاهو
فردا بلیت سینما برای چه کسانی رایگان است؟
پزشکیان: حمایت‌های معیشتی باید هدفمند باشد/ مدیریت مصرف یک ضرورت ملی است
نورنما | نفس گیرترین نقطه اورست اینجاست
شرط بازگشایی نماد شرکت‌های آسیب‌دیده در بورس اعلام شد
مرزبانان در سنگرهای انفرادی دست به ماشه آماده‌اند
پشت‌پرده بی‌اعتمادی بن‌سلمان به ترامپ/ چرا عربستان به دنبال ائتلاف جدید با ایران است؟
عملیات انهدام مهمات در قم/ شهروندان نگران نباشند
شمارش معکوس برای حراج 147/تالار شمش طلا از ساعت 14 امروز باز می‌شود
پیام اختصاصی رهبر معظم انقلاب به خانواده شهدای آملی جنگ رمضان
فرودگاه امام (ره) دوباره 24 ساعته شد
واقعیت نگران‌کننده پشت پرده ذخایر سدهای کشور
سقف حقوق و پاداش کارکنان دولت تغییر کرد
محور پکن-مسکو مستحکم‌تر از همیشه
ضرب‌شست دادستانی به فراریان مالیاتی/ وصول 139 همت از مطالبات دولتی
قیمت گوشت قرمز امروز 29 اردیبهشت 1405 + جدول
قیمت طلای جهانی امروز سه شنبه 29 اردیبهشت 1405 / اونس طلا تقویت شد
چگونه با وثیقه سهام وام 200 میلیون تومانی بگیریم؟ +جزئیات
هزینه جنگ علیه ایران برای آمریکا از 85 میلیارد دلار فراتر رفت
سرلشکر عبداللهی: نیروهای مسلح دست بر ماشه و آماده‌تر از همیشه‌اند
ریانووستی: توان دفاعی ایران برای هر سناریویی آماده است
نوراینفو | با خواب آلودگی بهاری چه کنیم ؟
اجرای طرح ترافیک فعلا با شیوه سال گذشته
ادامه وضعیت قابل قبول کیفیت هوا در تهران
بازداشت دو عنصر نفوذی که در پوشش خبرنگار جاسوسی می کردند
عوارض خطرناک تزریق بی‌رویه سرم از تشنج تا اِدم مغزی
عقب‌نشینی فلزات گرانبها در بازارهای جهانی
اعتراف رسانه‌های عبری به تغییر تاکتیک حزب‌الله/گذار به جنگ چریکی و آغاز مرحله فرسایشی
طرح حذف تیم ملی ایران توسط آمریکا شکست خورد
کدام ازدواج‌ها بیشتر در معرض طلاق هستند؟
ایران و آمریکا؛ توافق یا جنگ؟
مارکوس رشفورد، شاگرد آقای خاص می‌شود؟
ادامه مذاکرات، مانع جنگ
آیا ترامپ ماشه جنگ با کوبا را می‌چکاند؟
آغاز واریز حقوق بازنشستگان تامین اجتماعی از امروز +احکام جدید تا پانزدهم خرداد صادر می شود
جاده قدیم چالوس مسدود شد؛ از مسیر جایگزین بروید
قیمت خودرو امروز 29 اردیبهشت 1405/ ترمز افزایش قیمت خودرو کشیده شد؟ + جدول
«قدرت معنایی»؛ مهم‌ترین سنگر برای عبور از بحران
بیشترین گروهی که از اختلال و قطعی اینترنت آسیب می‌بینند زنان هستند
بازآرایی نیروها برای خنثی‌سازی تهدید در مبدأ، معادلات را تغییر داد
چرا آمریکا نمی‌تواند ایران را شکست دهد؟
لیست نهایی برزیل برای جام جهانی 2026 اعلام شد؛ بازگشت نیمار به جمع طلایی پوشان
اولین روز معاملاتی بورس 1405؛ تقابل صف فروش سنگین با رشد نمادهای بانکی و خودرویی
70 درصد توان موشکی ایران کاملاً دست‌نخورده است
تاب‌آوری به مثابه یک سازه ملی
زنگ خطر خشکسالی در تهران دوباره به صدا درآمد
تجویزهای غیرمنطقی دارو تحت پوشش بیمه نخواهد بود
وزن گرفتن چین در راهبردهای جدید ایران
سیاست نامه | پزشکیان و رئیسی کجا به هم رسیدند؟