×
اقتصادی
شناسه خبر : 180274
تاریخ انتشار : سه‌شنبه 1403/04/12 ساعت 14:46
نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی و ارائه تعدادی از مدل‌های زبانی توسعه یافته توسط گروه MCINext که سیستم‌های مرتبط هوش مصنوعی، در نمایشگاه الکامپ 1403 برگزار شد.

نورنیوز-گروه اقتصادی: گروه MCINext همراه اول در سومین روز برگزاری نمایشگاه بین المللی الکامپ ۱۴۰۳، ضمن رونمایی تعدادی از مدل های زبانی توسعه یافته خود شامل سیلک (با ۱.۳ میلیارد پارامتر)، آهوران (با ۸ میلیارد پارامتر) و آوا (با ۱۳ میلیارد پارامتر) را با حضور آرش امینی، سرپرست تحقیق و توسعه هوش مصنوعی MCINEXT و حامد تهمورسی، مدیر ارشد فناوری MCINEXT در سالن خلیج فارس نمایشگاه بین المللی تهران، در نشستی تخصصی کارکردها و ویژگی های هر یک از آنها را ارائه کرد.

در این نشست، علاوه بر تاکید روی توسعه محصولات مبتنی بر هوش مصنوعی، دستاوردهای این مجموعه از جمله ربات پاسخگو همراه اول و چند مدل زبانی که برای استفاده همگانی در دسترس قرار گرفته اند نیز معرفی شدند.

مدل های زبانی بزرگ (LLM)، سیستم های هوش مصنوعی هستند که با تحلیل و یادگیری از حجم زیادی از داده های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر نیز با حمایت مرکز تحقیق و توسعه همراه اول توسعه یافته اند.

در ادامه به صورت اجمالی هر یک از مدل های زبانی بزرگ گروه MCINEXT همراه اول معرفی و ارائه شدند.

*مدل زبانی سیلک (Sialk)

مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده است، با وجود تعداد پارامتر نسبتا کم، قابلیت زبانی خوبی را به نمایش می گذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.

*مدل زبانی آهوران (Ahoran)

مدل آهوران بر پایه مدل چند زبانه Llama۳ شرکت Meta و به صورت آموزش ادامه دار (continual pretraining) بر روی یک مجموعه دادگان فارسی توسعه داده شده است. با توجه به قابلیت های زیاد مدل پایه، ادامه آموزش، باعث تقویت تولید متن به زبان فارسی شده در حالیکه قابلیت های دیگر مدل تا حد زیادی حفظ شده است.

کاربردهای تجاری این مدل ها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت بات ها، تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان است. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

*مدل زبانی آوا (Ava)

مدل آوا به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere توسعه داده شده است.

بر خلاف دو مدل قبلی که جوابگوی سوالات کلی هستند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخگویی است (RAG) و تا حد امکان از ارائه اطلاعات استفاده شده در حین آموزش پرهیز می کند؛ استفاده اصلی این مدل در ربات های پاسخگوی خاص منظوره است.

علاوه بر آموزش این مدل ها، تلاش شده است تا به کمک روش های همترازسازی (RLHF و DPO) از تولید محتوای آسیب زا جلوگیری شود.

علاقه مندان می توانند از طریق نشانی https://llm.mcinext.org به این مدل های زبانی دسترسی پیدا کنند.


نورنیوز
نظرات

آخرین اخبار
پیشنهاد انتقال بازی‌های ایران در جام جهانی به مکزیک
هدف دشمن از حمله به حافظان امنیت چیست؟
گاردین: ایران درخواست های ویتکاف برای آتش‌بس را رد کرد
قیمت دلار توافقی امروز پنجشنبه 21 اسفند 1404
نماز جمعه روز قدس به امامت آیت الله خاتمی اقامه می شود
شل و توتال: گازی برای تحویل نداریم
هجوم رانندگان آلمانی به پمپ‌بنزین‌های اتریش
چرا بازگشایی تنگه هرمز برای اقتصاد آمریکا مهم است؟
برخی پایگاه‌های نظامی آمریکا در منطقه به تهدید مستقیم علیه ایران تبدیل شدند
قیمت طلای جهانی امروز پنجشنبه 21 اسفند 1404
تعطیلی بنادر نفتی عراق
بارش برف و باران در محورهای 13 استان
تجاوز شبانه به شهرک‌های صنعتی رباط‌کریم
ورود سامانه بارشی جدید به کشور از امروز
مخالفت آمریکا با درخواست های اسکورت در تنگه هرمز
رئال با کولاک والورده، سیتی را تسلیم کرد
حمله هوایی رژیم صهیونسیتی به سه واحد صنعتی در اراک
تلگراف: ترامپ دیگر قدرت متوقف کردن جنگ علیه ایران را ندارد
انتقاد شدید روسیه و چین از تصویب قطعنامه یکجانبه علیه ایران
بازی‌های موبایلی آرامش‌بخش و آفلاین، برای همه رده‌های سنی
افزایش دوباره بهای نفت در بازارهای جهانی
انگلیس: یک کشتی دیگر در تنگه هرمز آتش گرفت
در اسرائیل سانسور رسانه‌ای حکم‌فرماست تا حملات ایران و حزب‌الله مخابره نشوند!
راه‌آهن اسرائیل هک شد
سرمایه‌گذاران در حال خارج کردن پول‌هایشان از امارات هستند
افزایش قیمت سوخت در آمریکا
عبور قیمت نفت از 100 دلار
بازگشت آخرین گروه از حجاج ایرانی به کشور
رویترز: پس از دو هفته بمباران بی‌وقفه، حکومت ایران در آستانه فروپاشی نیست
احتمال بازبینی روابط امنیتی کشورهای حوزه خلیج فارس با آمریکا
نرخ بنزین در اروپا دستوری شد
ایران پاسخ حمله به مخازن پالایشگاه تهران را داد
فارن افرز: ایران معادله جنگ را تغییر داد، ادامه جنگ به نفع ایران است
مقاومت عراق: امارات به تأسیسات نفتی سعودی حمله کرد
زلزله در بازار کشورهای عربی با تداوم تجاوز آمریکا به ایران/سرمایه‌ها از دبی فراری شدند
لغو پروازهای بریتیش ایرویز به ابوظبی و چندین کشور خاورمیانه‌
در صورت خطای آمریکا تنگه ای دیگر، مشابه هرمز خواهد شد
وقوع حادثه برای دو نفتکش خارجی سوخت عراق در آب‌های بین المللی
حمله پهپادی حزب الله لبنان به بزرگترین مجتمع صنایع نظامی رژیم صهیونیستی
آخرین اخبار از حملات آمریکایی-صهیونیستی به تهران و مناطق مختلف کشور/ انهدام پهپاد هرون TP
بسیاری از مردم و بسیجیان برای حضور در ایست‌های بازرسی داوطلب شدند
روسیه: قطعنامه شورای امنیت علیه ایران جانبدارانه و یک‌طرفه بود
نفتکش آمریکایی در نزدیکی عراق هدف قرار گرفت
موج 40 عملیات وعده صادق4 / شلیک موشک به بیش از 50 هدف در سراسر اراضی اشغالی
تناقض گویی‌های ترامپ: در 11 روز گذشته ارتش ما ایران را عملا نابود کرد
آمار تعداد زنان و کودکان شهید در حملات آمریکایی-صهیونیستی
اختلال در شناسایی زمان شلیک موشک‌های ایران در اسرائیل
نماینده ایران در سازمان ملل: قطعنامه شورای امنیت تحریف واقعیت بود
بیانیه ها و پیام های بیعت با آیت‌الله سیدمجتبی خامنه‌ای رهبر معظم انقلاب اسلامی ایران
حملات گسترده حزب‌الله به شمال فلسطین اشغالی