Я ищу, чтобы найти предварительно обученные веса уже обученных моделей, таких как данные Новостей Google и т. Д. Мне было трудно обучать новую модель с достаточным количеством данных (10 ГБ и т. Д.) Для себя. Итак, я хочу извлечь выгоду из трансферного обучения, в котором я смог бы получить предварительно обученные веса слоя и переучить эти веса для слов, относящихся к моей области. Так что определенно это займет относительно меньше времени на тренировках. Любая помощь будет высоко оценена. Заранее спасибо :)
источник
model = Word2Vec.load(fname) # you can continue training with the loaded model!
Распределенные представления (Перчатка), основанные на обучении на большом корпусе, напрямую доступны из группы Stanford NLP. Вы можете использовать эти вложения слов непосредственно в своем приложении (вместо использования 1 горячо закодированных векторов, а затем обучать сеть для получения встраиваний). Если ваша задача не слишком специализирована, запуск с этим набором вложений будет хорошо работать на практике.
источник
Взгляните на эту статью [PDF] . Основное внимание уделяется задаче NER, но идея та же: взять предварительно обученные векторы word2vec и адаптировать их для конкретного приложения.
Многие распространенные приложения для НЛП на основе нейронных сетей часто начинаются с предварительно обученных векторов. Например, в недавней статье [PDF] (задачи с тегами NER и POS) именно это и делается.
источник
источник