×
اقتصادی
شناسه خبر : 180274
تاریخ انتشار : سه‌شنبه 1403/04/12 ساعت 14:46
نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی و ارائه تعدادی از مدل‌های زبانی توسعه یافته توسط گروه MCINext که سیستم‌های مرتبط هوش مصنوعی، در نمایشگاه الکامپ 1403 برگزار شد.

نورنیوز-گروه اقتصادی: گروه MCINext همراه اول در سومین روز برگزاری نمایشگاه بین المللی الکامپ ۱۴۰۳، ضمن رونمایی تعدادی از مدل های زبانی توسعه یافته خود شامل سیلک (با ۱.۳ میلیارد پارامتر)، آهوران (با ۸ میلیارد پارامتر) و آوا (با ۱۳ میلیارد پارامتر) را با حضور آرش امینی، سرپرست تحقیق و توسعه هوش مصنوعی MCINEXT و حامد تهمورسی، مدیر ارشد فناوری MCINEXT در سالن خلیج فارس نمایشگاه بین المللی تهران، در نشستی تخصصی کارکردها و ویژگی های هر یک از آنها را ارائه کرد.

در این نشست، علاوه بر تاکید روی توسعه محصولات مبتنی بر هوش مصنوعی، دستاوردهای این مجموعه از جمله ربات پاسخگو همراه اول و چند مدل زبانی که برای استفاده همگانی در دسترس قرار گرفته اند نیز معرفی شدند.

مدل های زبانی بزرگ (LLM)، سیستم های هوش مصنوعی هستند که با تحلیل و یادگیری از حجم زیادی از داده های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر نیز با حمایت مرکز تحقیق و توسعه همراه اول توسعه یافته اند.

در ادامه به صورت اجمالی هر یک از مدل های زبانی بزرگ گروه MCINEXT همراه اول معرفی و ارائه شدند.

*مدل زبانی سیلک (Sialk)

مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده است، با وجود تعداد پارامتر نسبتا کم، قابلیت زبانی خوبی را به نمایش می گذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.

*مدل زبانی آهوران (Ahoran)

مدل آهوران بر پایه مدل چند زبانه Llama۳ شرکت Meta و به صورت آموزش ادامه دار (continual pretraining) بر روی یک مجموعه دادگان فارسی توسعه داده شده است. با توجه به قابلیت های زیاد مدل پایه، ادامه آموزش، باعث تقویت تولید متن به زبان فارسی شده در حالیکه قابلیت های دیگر مدل تا حد زیادی حفظ شده است.

کاربردهای تجاری این مدل ها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت بات ها، تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان است. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

*مدل زبانی آوا (Ava)

مدل آوا به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere توسعه داده شده است.

بر خلاف دو مدل قبلی که جوابگوی سوالات کلی هستند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخگویی است (RAG) و تا حد امکان از ارائه اطلاعات استفاده شده در حین آموزش پرهیز می کند؛ استفاده اصلی این مدل در ربات های پاسخگوی خاص منظوره است.

علاوه بر آموزش این مدل ها، تلاش شده است تا به کمک روش های همترازسازی (RLHF و DPO) از تولید محتوای آسیب زا جلوگیری شود.

علاقه مندان می توانند از طریق نشانی https://llm.mcinext.org به این مدل های زبانی دسترسی پیدا کنند.


نورنیوز
نظرات

آخرین اخبار
رایزنی ویتکاف و عبدالعاطی درباره پرونده مذاکرات میان ایران و آمریکا
جزئیات گفتگوی تلفنی «عراقچی» و «کایا کالاس»
آغاز سفر دریایی گردشگران به کیش از فردا
چین ریاست شورای امنیت را بر عهده گرفت
صادرات نفت خام عراق از مرز سوریه آغاز شد
سناتور دموکرات تلفات ارتش آمریکا را فاش کرد
پالتیکو: ترامپ مدعی پایان جنگ ایران شد
آرامگاه محمدرضا لطفی ساخته می شود
پیام تبریک عراقچی به نخست وزیر جدید عراق
محسن رضایی: آمریکایی‌ها درس‌های زیادی در خلیج فارس یاد خواهند‌ گرفت
نبیه بری: تجاوزات اسرائیل در آتش‌بس تشدید شد
مدیریت جدید خلیج فارس بر مدار فرمان رهبر معظم انقلاب
احتمال شنیدن صدای انفجارهای کنترل شده در عسلویه
ازسرگیری پروازهای رشت- مشهد و بالعکس
جو کنت: اسرائیل امریکا را برای جنگ متقاعد کرد
دیدار اعضای فراکسیون وفاداری به مقاومت لبنان با سفیر ایران در بیروت
سی ان ان:تقریبا همه سایت‌های نظامی آمریکا در خاورمیانه تخریب شده اند
سودجویان بازار خودرو را آشفته کردند
فرماندهی کل سپاه: کارگران پیشران‌ پیشرفت عزت و عظمت کشور
مخالفت ترامپ با ضرب‌الاجل 60 روزه برای جنگ با ایران
دیدار فیدان با رئیس سازمان الحشد الشعبی عراق
توقف ساخت‌وساز غیرمجاز در حریم یک اثر تاریخی در لرستان
شهادت 14 نفر در عملیات پاکسازی مهمات در زنجان
ترور امام جماعت حرم حضرت زینب (ع) در سوریه
ترامپ در دستیابی به اهداف جنگ علیه ایران ناکام مانده است
جسد مرد مفقودی در سد شاه‌قاسم بویراحمد کشف شد
محاصره دریایی آمریکا پرخطر و کم‌دستاورد است
8 مصدوم در تصادف زنجیره‌ای محور آذرشهر-گنبرف
61 درصد آمریکایی‌ها مخالف اقدام نظامی علیه ایران
امارات با خروج از اوپک تنش نفتی با عربستان را آغاز کرد
رایزنی تلفنی عراقچی و لاوروف
چین: تنگه هرمز باید هرچه سریع‌تر بازگشایی شود
5 کشته در سانحه سقوط هواپیما در تگزاس
واردات خودرو ممنوع نیست
موزه هنرهای معاصر تهران میزبان نمایشگاه «هنر و جنگ» می شود
کشف 8000 فشنگ جنگی در شهرستان شوش
دلافوئنته: یامال را برای مراحل حذفی نگه می‌داریم
ناوشکن آمریکایی در اقیانوس آرام آتش گرفت
تحریم سه صرافی ایرانی از سوی آمریکا
معلمان و کارگران ستون فقرات عرصه فرهنگ و اقتصاد هستند
تعرفه واردات خودرو از اتحادیه اروپا 25 درصد شد
دستگیری قاتل در پیشوا در کمتر از یک ساعت
حمله به مدرسه میناب، یک جنایت جنگی از پیش طراحی شده
حملات بی سابقه حزب‌الله به اهداف نظامی رژیم صهیونیستی
نگرانی سازمان جهانی بهداشت از فروپاشی نظام سلامت در غزه
معاون صدراعظم آلمان: به توصیه‌های ترامپ نیازی نداریم
صعود فوتسالیست های دائم‌پناه مشهد به لیگ برتر
رونمایی چین از جدیدترین ابررایانه خود
فلسطین، اینفانتینو را سنگ روی یخ کرد
محکومیت حمله به راهبه در قدس از سوی رهبران مسیحی