×
اقتصادی
شناسه خبر : 180274
تاریخ انتشار : سه‌شنبه 1403/04/12 ساعت 14:46
نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی و ارائه تعدادی از مدل‌های زبانی توسعه یافته توسط گروه MCINext که سیستم‌های مرتبط هوش مصنوعی، در نمایشگاه الکامپ 1403 برگزار شد.

نورنیوز-گروه اقتصادی: گروه MCINext همراه اول در سومین روز برگزاری نمایشگاه بین المللی الکامپ ۱۴۰۳، ضمن رونمایی تعدادی از مدل های زبانی توسعه یافته خود شامل سیلک (با ۱.۳ میلیارد پارامتر)، آهوران (با ۸ میلیارد پارامتر) و آوا (با ۱۳ میلیارد پارامتر) را با حضور آرش امینی، سرپرست تحقیق و توسعه هوش مصنوعی MCINEXT و حامد تهمورسی، مدیر ارشد فناوری MCINEXT در سالن خلیج فارس نمایشگاه بین المللی تهران، در نشستی تخصصی کارکردها و ویژگی های هر یک از آنها را ارائه کرد.

در این نشست، علاوه بر تاکید روی توسعه محصولات مبتنی بر هوش مصنوعی، دستاوردهای این مجموعه از جمله ربات پاسخگو همراه اول و چند مدل زبانی که برای استفاده همگانی در دسترس قرار گرفته اند نیز معرفی شدند.

مدل های زبانی بزرگ (LLM)، سیستم های هوش مصنوعی هستند که با تحلیل و یادگیری از حجم زیادی از داده های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر نیز با حمایت مرکز تحقیق و توسعه همراه اول توسعه یافته اند.

در ادامه به صورت اجمالی هر یک از مدل های زبانی بزرگ گروه MCINEXT همراه اول معرفی و ارائه شدند.

*مدل زبانی سیلک (Sialk)

مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده است، با وجود تعداد پارامتر نسبتا کم، قابلیت زبانی خوبی را به نمایش می گذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.

*مدل زبانی آهوران (Ahoran)

مدل آهوران بر پایه مدل چند زبانه Llama۳ شرکت Meta و به صورت آموزش ادامه دار (continual pretraining) بر روی یک مجموعه دادگان فارسی توسعه داده شده است. با توجه به قابلیت های زیاد مدل پایه، ادامه آموزش، باعث تقویت تولید متن به زبان فارسی شده در حالیکه قابلیت های دیگر مدل تا حد زیادی حفظ شده است.

کاربردهای تجاری این مدل ها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت بات ها، تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان است. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

*مدل زبانی آوا (Ava)

مدل آوا به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere توسعه داده شده است.

بر خلاف دو مدل قبلی که جوابگوی سوالات کلی هستند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخگویی است (RAG) و تا حد امکان از ارائه اطلاعات استفاده شده در حین آموزش پرهیز می کند؛ استفاده اصلی این مدل در ربات های پاسخگوی خاص منظوره است.

علاوه بر آموزش این مدل ها، تلاش شده است تا به کمک روش های همترازسازی (RLHF و DPO) از تولید محتوای آسیب زا جلوگیری شود.

علاقه مندان می توانند از طریق نشانی https://llm.mcinext.org به این مدل های زبانی دسترسی پیدا کنند.


نورنیوز
نظرات

آخرین اخبار
تداخل وارفارین با آنتی‌بیوتیک‌ها؛ خطری جدی برای سالمندان
کشف کلید مولکولی آلزایمر؛ امید تازه برای محافظت از حافظه
مازندران رتبه برتر کاهش تصادفات جاده‌ای کشور را کسب کرد
وزارت دفاع ایران اقدام اتحادیه اروپا علیه سپاه را محکوم کرد
از جنگ استقبال نمی‌کنیم اما مذاکرات متوازن را می‌پذیریم
لغو وضعیت اقامت ونزوئلایی‌ها توسط دولت ترامپ غیرقانونی است
صعود اندونزی، عراق، ویتنام و تایلند به مرحله حذفی فوتسال آسیا
اقدام اروپا خللی در مأموریت‌های سپاه ایجاد نمی‌کند
بازسازی سرمایه اجتماعی و تقویت تاب‌آوری، اولویت فوری کشور است
گوترش: توافق بر سر پرونده هسته‌ای ایران مهم است
ترامپ با جانشین «مادورو» گفت و گو کرد
واکنش رئیس مجلس به اقدام سیاسی اروپا
بسته حمایتی مجلس از سپاه در برابر اقدام اتحادیه اروپا
بیانیه وزارت خارجه در محکومیت شدید مصوبه وزرای خارجه اتحادیه اروپا
غیبت احتمالی دانشجویان در امتحانات موجه می شود
سرانه مصرف آب در کشور 12.7 مترمکعب است
مقام حزب‌الله: هر تحرک نظامی آمریکا علیه ایران منطقه را به انفجار می‌کشاند
وزیر جنگ آمریکا: ایران نباید به‌سمت توانمندی هسته‌ای حرکت کند
همه به‌ویژه آمریکا باید اسرائیل را تحت فشار قرار دهند
سخنگوی ارتش: اگر دشمن حماقت کند «بلادرنگ» پاسخ خواهیم داد
رایزنی کشورهای اروپایی برای ایجاد چتر هسته‌ای مشترک
لاوروف : تضمین‌های واشنگتن-کی‌یف، صلح پایدار در اوکراین را تضمین نمی‌کند
تراکتور بدون مجوز رسمی در دیدار جام حذفی حاضر نشد
کولاک برف در آزاد راه تهران - شمال ؛ از سفر غیر ضرور پرهیز کنید
روابط بغداد و واشنگتن باید بر اصل عدم مداخله استوار باشد
منطقه به جنگ تازه نیاز ندارد
ترامپ: پوتین با توقف یک هفته‌ای بمباران اوکراین موافقت کرد
روسیه آماده میانجیگری میان ایران و آمریکا است
نجات کشتی باری ایرانی «کاسپین شیوا» در نزدیکی بندر داغستان روسیه
اکثریت آلمانی‌ها خواستار بازگرداندن ذخایر طلای کشور از آمریکا شدند
هتک حرمت حرم سبزقبا چهره واقعی دشمنان ایران را آشکار کرد
حمایت مقاومت اسلامی بحرین از رهبر انقلاب و هشدار به آمریکا
امید عالیشاه در آستانه بازگشت به میادین
ریاست جمهوری عراق: مداخلات خارجی در امور سیاسی کشور قابل قبول نیست
هزینه تسلیم از جنگ کمتر نیست؛ تهران آماده است
پزشکیان: ایران در دفاع از خود تردید نمی‌کند
رئیس‌جمهور کلمبیا: آمریکای لاتین باید یک صدا بایستد
اروپا برای نخستین بار آمریکا را تهدیدی برای خود خواند
هرگونه دخالت خارجی در روند انتصابات غیرقابل قبول است
240 حقوقدان ایرانی خواستار تعقیب قضایی ترامپ و دولت آمریکا شدند
دستگیری 115 نفر از اغتشاشگران در رودبار
شکست چادرملو مقابل ملوان در انزلی
خودروسازان بدون مجوز حق افزایش قیمت ندارند
سامانه بارشی تا جمعه در زنجان فعال است
زمین‌لرزه 3.2 ریشتری بار دیگر حوالی پارسیان هرمزگان را لرزاند
ذوق زدگی تروریست‌های اسرائیلی از اقدام اروپا علیه سپاه پاسداران
وزیر امور خارجه: اروپا مرتکب یک اشتباه راهبردی بزرگ شد
همتی: نتایج مثبت یکپارچه‌سازی نرخ ارز به مرور زمان خود را نشان خواهد داد
بیانیه ستاد کل نیروهای مسلح در واکنش به تروریستی اعلام شدن سپاه پاسداران
ادعای الجزیره: ایران با چین و روسیه رزمایش دریایی برگزار می‌کند