Помеченные вопросы [nlp]

1 голосов
0 ответы
TomekLinks fit_sample (X, y) занимает много времени
Я работаю над проблемой классификации текста. Я использую класс TomekLinks модуля imblearn для повторной выборки моих данных. Но после вызова ме...
спросил 2 месяца назад
0 голосов
0 ответы
Ошибка при использовании eval с новым сеансом или текущим сеансом
Я пытаюсь создать пользовательскую функцию потерь в кератах, которая является максимальной маржинальной потерей. В функции потерь необходимо соз...
спросил 2 месяца назад
0 голосов
1 ответы
Как применить функцию ко всему набору данных - Python?
У меня есть фрейм данных, который называется «данные», вот так: id email_body 1 text_1 2 text_2 3 text_3 4 text_4 5...
спросил 2 месяца назад
0 голосов
0 ответы
Есть ли способ поиска извлеченных функций с помощью Python?
Я использовал векторизацию td-idf для извлечения объектов в задаче классификации текста, и теперь я хочу найти определенные извлеченные объекты....
спросил 2 месяца назад
3 голосов
2 ответы
Нормализация текста: сходство текста в Python. Как нормализовать несоответствие орфографии текста?
у меня есть кадр данных со столбцом A, как показано ниже: Column A Carrefour supermarket Carrefour hypermarket Carrefour carrefour Carrfour do...
спросил 2 месяца назад
1 голосов
4 ответы
Как найти это слово «অশুভ» в моей строке с помощью регулярного выражения?
Я пытаюсь найти это слово с помощью регулярного выражения. Но проблема, которую я обнаружил, заключается в том, что всякий раз, когда я пытался...
спросил 2 месяца назад
1 голосов
0 ответы
NLTK PlainTextCorpusReader показывает AssertionError при подсчете предложений / параграфов в нескольких текстовых файлах
Я использую PlainTextCorpusReader для анализа около 40 текстовых файлов. Файлы легко импортируются, но когда я пытаюсь подсчитать количество пре...
спросил 2 месяца назад
0 голосов
2 ответы
«Как узнать существительное, к которому относится местоимение» в python
Я хочу выяснить смысл предложения для того же, что и мне, чтобы выяснить, к какому местоимению сущности относится. Рассмотрим пример    Ме...
спросил 2 месяца назад
4 голосов
4 ответы
Генерация n-грамм из строки
Мне нужно составить список всех grams -грамм, начинающихся с заголовка строки для каждого целого числа 𝑛 от 1 до M. Затем вернуть кортеж из M та...
спросил 2 месяца назад
0 голосов
1 ответы
Удаление текста «ЧЕЛОВЕК» из текста?
>>> import spacy >>> en = spacy.load('en') >>> text = "Joe is walking down the street. He is wondering if Dan Jordan w...
спросил 2 месяца назад
1 голосов
0 ответы
Алгоритм повторяемости документов
У меня есть коллекция документов, которые были написаны в 2 разных периода времени. Существует предположение, что документ, написанный в период...
спросил 2 месяца назад
2 голосов
2 ответы
Индекс внедрения Pytorch вне диапазона
Я следую этому руководству здесь https: //cs230-stanford.github. IO /pytorch-nlp.html . Там создается нейронная модель с использованием nn.Modu...
спросил 2 месяца назад
0 голосов
0 ответы
Вопрос, отвечающий НЛП из данного комплекта документов
Каков наилучший способ реализовать проект, отвечающий на вопросы НЛП, где вопрос формата (кто, кого, когда) и ответа взят из заданного набора до...
nlp
спросил 2 месяца назад
0 голосов
0 ответы
Найти категории вопросов, используя предопределенный словарь [перенесено]
Я хочу создать функцию, которая будет автоматически предлагать категории, когда пользователь вводит вопросы. Первый шаг, который я сделал, -...
спросил 2 месяца назад
0 голосов
0 ответы
Как увеличить скорость этой нер-модели, реализованной с нуля, используя 1 миллион помеченных предложений
Я хотел бы использовать модель NER в Spacy для обучения модели с нуля, используя 1 миллион предложений. Модель имеет только два типа объектов. Э...
спросил 2 месяца назад
0 голосов
0 ответы
Модель языка маски BERT
Я начал анализировать статью BERT , выполненную Google ( https: //arxiv .org /abs /1810.04805 ) и наткнулся на несколько моментов, которые я не...
спросил 2 месяца назад
1 голосов
1 ответы
Настройка BERT на пользовательских данных
Я хочу обучить модель классификации текста 21 класса с помощью Берта. Но у меня очень мало обучающих данных, поэтому я скачал похожий набор да...
спросил 2 месяца назад
0 голосов
1 ответы
Как точно настроить BERT на собственные задачи? [закрыто]
Я хотел предварительно обучить BERT данными из моего собственного языка, поскольку многоязычная (включая мой язык) модель BERT не удалась. Поско...
спросил 2 месяца назад
0 голосов
0 ответы
Как получить правильную метку keras model.predict (проблема НЛП)
Я реализовал небольшую нейронную сеть LSTM для прогнозирования заметок для фильма. Но у меня есть проблема с интерпретацией, чтобы преобразовать...
спросил 2 месяца назад
0 голосов
0 ответы
Предварительная обработка. TXT файлов для НЛП
У меня более сотни неструктурированных TXT-файлов (статей), которые мне нужны для предварительной обработки для NLP. Должен ли я сначала преобра...
спросил 2 месяца назад
-1 голосов
0 ответы
Как получить частоту значений столбцов dataframe_1 по сравнению с другим dataframe_2
У меня есть 2 датафрейма. один кадр данных содержит столбец 1, то есть кластеры с уникальным номером: 550, а другой столбец имеет токены, соотве...
спросил 2 месяца назад
1 голосов
1 ответы
Как десериализовать обученную модель OpenNLP?
Я использую OpenNLP с Java для классификации текста. Я использовал объект DoccatModel. Затем я сохраняю его с помощью метода serialize. Я хотел...
спросил 2 месяца назад
0 голосов
0 ответы
Как использовать RNewsFlow's documents.compare сходство dtm (dtm разного размера)?
Я хочу сравнить сходство между одним DTM и другим DTM. Но в них различное количество документов. Я не уверен, что я делаю неправильно. nrow (...
r nlp
спросил 2 месяца назад
0 голосов
1 ответы
argmax из вероятностного распределения лучше политики, чем случайная выборка из softmax?
Я пытаюсь обучить Echo State Network для генерации текста со стохастической оптимизацией по линии обучения подкреплению, где оптимизация зависит...
спросил 2 месяца назад
1 голосов
0 ответы
Как классифицировать текстовые данные с сотнями классов и меньшим количеством образцов в каждом классе
У меня есть набор данных, который содержит около 10000 небольших абзацев, и абзацы принадлежат классам. Есть около 80 - 100 классов. Абзацы могу...
спросил 2 месяца назад