Научен успех от световен мащаб: INSAIT представи първия генеративен изкуствен интелект на български език

Чат приложение за всички българи: до края на седмицата INSAIT пуска нова функционалност

Ноември 20, 2024 - 14:40

Научен успех от световен мащаб: INSAIT представи първия генеративен изкуствен интелект на български език

На 19 ноември Институтът за компютърни науки, изкуствен интелект и технологии (INSAIT) представи изкуствен интелект от ново поколение, създаден да работи на български език. Така страната ни става първата държава в Европейския съюз, която разполага с изкуствен интелект на толкова високо технологично ниво на собствения ѝ език, създаден от научна организация с държавно финансиране. Технологията може да се използва свободно и да бъде внедрена в системата на всяка българска институция, компания или организация.

„Това е постижение на световно ниво, което показва какви са възможностите на българските наука и научни организации“, коментира по време на представянето министър-председателят Димитър Главчев и допълни, че политиката по отношение на тази дейност е последователна. На заседанието на Министерския съвет миналата седмица правителството отпусна следващия транш от средствата, необходими на института да продължи работата си. „От 2021 година всяко едно правителство е отпускало средства по този проект и това е добър пример как всички заедно вършим работата си, която е в интерес на цялото общество“, допълни премиерът. Той подчерта, че това е единствената област, в която България изпреварва другите държави в ЕС, като същевременно проектът допринася и за запазването на българския език.

„Новата технология може да се използва за създаване на учебно съдържание, за персонализирано обучение, за научни изследвания и за облекчаване на административната работа“, каза министърът на образованието и науката проф. Галин Цоков. Той припомни, че в следващата година МОН ще започне и изпълнение на нов проект за дигитализация на образованието, който ще подпомогне технологично българските образователни институции.

По време на представянето научният директор на INSAIT проф. Мартин Вечев и изпълнителният директор на структурата инж. Борислав Петров поставиха акцент върху няколко големи предимства на новата технология. На първо място е информационната сигурност – българските организации и общество ще могат да използват модела без да се налага да споделят данните си с външни компании. От друга страна изкуственият интелект ще работи на български език и ще бъде запознат с местната фактология, култура, история и законодателство. Продуктите, които отразяват тези езиковите особености, са в пъти по-ефективни от универсалните.

Новата технология има огромно стратегическо значение за сигурността и развитието на иновациите в България. Създаването на собствени модели с изкуствен интелект е приоритет на редица държави, които тепърва инвестират стотици милиони в тази посока, а страната ни вече има готов продукт. „Това е важна национална политика, тъй като контролът върху изкуствения интелект намалява зависимостта от чужди технологии и гарантира сигурност и суверенитет“, допълни проф. Вечев.

До края на седмицата учените от INSAIT ще финализират и пускането на чат приложение, което ще се използва свободно от цялото българско общество.

Новият генеративен модел на INSAIT е свободно достъпен на https://models.bggpt.ai. Той превъзхожда на български в пъти по-големи и по-скъпи за ползване отворени модели, като например 70-милиардния Llama 3.1 на Мета. Интересен факт е, че той превъзхожда и свободната версия на ChatGPT (GPT-4o-mini) и си съперничи с последната платена версия (GPT-4o) за чат-производителност на български. Това твърдение идва от самия GPT-4o след редица направени тестове, в които изкуственият интелект на американската компания OpenAI е ползван за арбитър между себе си и българския модел. Подобни са и резултатите спрямо последните модели на Anthropic, друга водеща американска компания за изкуствен интелект.

Моделите на INSAIT са базирани на отворените модели Gemma-2 на Google, но производителността им на български става възможна благодарение на научни изследвания, проведени в института INSAIT през последната година. Те водят до създаването на нова технология, която позволява даден генеративен модел да бъде обучен с допълнителни знания (напр. български) без да забравя старите си умения (напр. английски). Технологичният пробив беше публикуван в EMNLP’24, водеща конференция за изкуствен интелект, проведена миналата седмица в Маями, САЩ.