[BigramAssocMeasures.likelihood_ratio]
natural language
regular expressions
language processing
naive bayes
regular expression
order logic
feature structures
frequency distribution
maximum entropy
conditional frequency
test set
named entity
feature extractor
brown corpus
lexical resources
computational linguistics
frequency distributions
recursive descent
writing structured
monty python
[BigramAssocMeasures.raw_freq]
natural language
language processing
regular expressions
order logic
regular expression
feature structures
test set
brown corpus
frequency distribution
text corpora
linguistic data
naive bayes
monty python
corpus import
conditional frequency
lexical resources
raw text
training set
accessing text
feature extractor
[BigramAssocMeasures.likelihood_ratio]
jamaica observer reported
ponds distributing swords
usain bolt broke
saving private ryan
kluwer academic publishers
fine fat trout
bevor der folgende
der folgende flug
directed acyclic graphs
strange women lying
larger cetacean mammals
presidential inaugural addresses
buffalo buffalo buffalo
readable phonetic alphabet
lol lol lol
recognizing textual entailment
wall street journal
formed substring tables
procedural versus declarative
iterative optimization techniques
[TrigramAssocMeasures.raw_freq]
natural language processing
accessing text corpora
processing raw text
writing structured programs
conditional frequency distribution
analyzing sentence structure
managing linguistic data
named entity recognition
naive bayes classifier
natural language understanding
phrase structure grammar
cambridge university press
conditional frequency distributions
recent call last
recursive descent parser
maximum entropy classifiers
naive bayes classifiers
regular expression tagger
corpus import brown
inaugural address corpus
простите, что вмешиваюсь, но хочу заметить, что эту задачу (сохранить
знания об уже сделанных похожих переводах, чтобы этим пользоваться в
дальнейшем) с легкостью решают инструменты "переводческой памяти". Я,
к сожалению, давно уже этим не занимался и не знаю, как там сейчас на
этом рынке (в оффлайне лидерами когда-то были Trados и Transit), но
знаю, что, например, у Гугла есть Google Translator Toolkit, который
включает в себя и онлайн софтину переводческой памяти (в духе Google
Docs) и возможность подключать туда глоссарии.