Национално издателство "Аз-буки"
Министерство на образованието и науката
Wikipedia
  • Вход
  • Регистрация
Вестник „Аз-буки”
Няма резултати
Вижте всички резултати
  • Начало
  • За вестника
  • Екип
  • Архив
    • Вестник “Аз-буки” онлайн издание
  • Контакт
  • Реклама
  • Абонамент
  • en_US
  • Начало
  • За вестника
  • Екип
  • Архив
    • Вестник “Аз-буки” онлайн издание
  • Контакт
  • Реклама
  • Абонамент
  • en_US
Няма резултати
Вижте всички резултати
Вестник „Аз-буки”
Няма резултати
Вижте всички резултати
Начало Uncategorized

Предизвикателства при обхождането на интернет с цел извличане на данни

„Аз-буки“ от „Аз-буки“
08-03-2024
в Uncategorized
A A

Георги Чолаков 1), Емил Дойчев 1),
Светла Коева 2)
1)Факултет по математика и информатика – ПУ „Паисий Хилендарски“ (България)
2)Институт за български език „Проф. Любомир Андрейчин“ – БАН (България)

https://doi.org/10.53656/math2024-1-1-cha

Резюме. Статията представя предизвикателствата при реализацията на Система за извличане и визуализация на данни от интернет посредством обхождането на езикови ресурси от хранилището Hugging Face и извличането на данни, свързани с тях. Данните в системата периодично се обновяват, за да се проследява динамиката при създаването на езикови ресурси за различни периоди. Статията представя анализа на достъпните данни, тяхната структура и избрания начин за обхождане на страниците и извличане на данните. Споделеният опит при преодоляването на конкретните предизвикателства може да послужи прирешаването на сходни проблеми, свързани с извличането на данни от интернет, задача, която често стои за разрешаване в различни проекти (включително ученически). Придобитият опит вследствие на описаната разработка показва, че подобен тип системи са силно зависими от имплементацията на обхождания източник на данни и при промяна в неговата структура на данни извличането трябва също да се актуализира, за да продължи да работи.
Ключови думи: уебобхождане; автоматично извличане на данни; набори от езикови данни

 

Влезте в системата, за да прочетете пълната статия Your Image Description

Свързани статии:

Default ThumbnailДвупараметрична задача за оптимално разпределение на ресурси Default ThumbnailИзграждане на позитивни нагласи за предприемачество и социална активност чрез иновативната обучителна система ILS (Innoschool) Default ThumbnailРезултати от външното оценяване по биология и здравно образование – VIII клас (2018/2019 г.) Default ThumbnailИма ли място „Новото изкуство“ в класните стаи? Алтернатива ли е моделът 1:1
Етикети: автоматично извличане на даннинабори от езикови данниуебобхождане

Последвайте ни в социалните мрежи

СподелянеTweet
Предишна статия

Видеопослание за Левски

Следваща статия

An Approach and a Tool for Euclidean Geometry

Следваща статия

An Approach and a Tool for Euclidean Geometry

Релевантни ли са утвърдените таксономии за обучение в електронна среда?

Student Satisfaction with the Quality of a Blended Learning Course

Последни публикации

  • Министерство на иновациите подкрепя с 10 млн.лв. проект на БАН за лазерно индуциран управляем ядрен синтез
  • Посрещнаха новопостъпилите млади учители в столичната образователната система
  • РУО – Варна, с фокус върху позитивното образование
  • Младежи от Бургас обединиха усилия срещу насилието
  • Професионалната техническа гимназия в Габрово ще обучава бъдещи пилоти на дронове
  • Опознай България чрез игра
  • Наши изследователи търсят как да заменят в батериите скъпия литий с евтиния натрий
  • Българските ученици с четири медала от Младежката международна олимпиада по астрономия и астрофизика
  • Красива заплаха се разпространява в САЩ
  • Сдружение „Младежки гвардейски отряди“ заведе по Програма „Еразъм+“ ученици и студенти на аудиенция при папа Лъв XIV
  • В СУ „Св.св. Кирил и Методий“ в с. Крупник всяко дете получава шанс да открие силните си страни, да мечтае и да се развива
  • Отличия за успешно образователно приобщаване на деца и ученици
  • Обучение за работа с данни ще помогне за по-точни анализи на резултатите от външните оценявания
  • Да използваме ли думата рутина в новите ѝ значения?
  • Проект на МОН с отличие за подобряване на хранителните навици на децата в детските градини
  • „Пресичам безопасно с TEDI“ гостува в ОУ „Антон Страшимиров“ – Бургас
  • Министър Вълчев откри обновени общежития за над 1200 бъдещи инженери и спортисти в София
  • Защо е важно да разграничаваме трудовия стаж от професионалния опит
  • Снимка на броя: Малките пекари
  • Доцент д-р Боряна Иванова, ректор на Аграрния университет – Пловдив: Бизнесът в сектора предпочита нашите кадри
  • INSAIT създаде модел, който дава на роботите триизмерен пространствен интелект
  • Приобщаването и интеграцията са във фокуса на работата на МОН

София 1113, бул. “Цариградско шосе” № 125, бл. 5

+0700 18466

izdatelstvo.mon@azbuki.bg
azbuki@mon.bg

Полезни линкове

  • Къде можете да намерите изданията?
  • Вход за абонати
  • Начало
  • Контакт
  • Абонамент
  • Проекти
  • Реклама

Вестник „Аз-буки”

  • Вестник “Аз-буки”
  • Абонамент
  • Архив

Научните списания

  • Стратегии на образователната и научната политика
  • Български език и литература
  • Педагогика
  • Математика и информатика
  • Обучение по природни науки и върхови технологии
  • Професионално образование
  • История
  • Чуждоезиково обучение
  • Философия

Бюлетин

  • Достъп до обществена информация
  • Условия за ползване
  • Профил на купувача

© 2012-2025 Национално издателство "Аз-буки"

Welcome Back!

Login to your account below

Forgotten Password? Sign Up

Create New Account!

Fill the forms bellow to register

All fields are required. Log In

Retrieve your password

Please enter your username or email address to reset your password.

Log In
bg_BG
en_US bg_BG
  • Вход
  • Sign Up
Няма резултати
Вижте всички резултати
  • Начало
  • За вестника
  • Екип
  • Архив
    • Вестник “Аз-буки” онлайн издание
  • Контакт
  • Реклама
  • Абонамент
  • en_US

© 2012-2025 Национално издателство "Аз-буки"