rupo.main package¶
Submodules¶
rupo.main.markup module¶
- class rupo.main.markup.Annotation(begin: int, end: int, text: str)[source]¶
Bases:
CommonMixin
Класс аннотации. Содержит начальную и конечную позицию в тексте, а также текст аннотации.
- class rupo.main.markup.Line(begin: int, end: int, text: str, words: List[Word])[source]¶
Bases:
Annotation
Разметка строки. Включает в себя аннотацию строки и её слова.
- class rupo.main.markup.Markup(text: Optional[str] = None, lines: Optional[List[Line]] = None)[source]¶
Bases:
CommonMixin
Класс данных для разметки в целом с экспортом/импортом в XML и JSON.
- from_raw(text: str) Markup [source]¶
Импорт из сырого текста с ударениями в конце слов
- Parameters
text – текст.
- Returns
разметка.
- from_xml(xml: str) Markup [source]¶
Импорт из XML.
- Parameters
xml – XML-разметка
- Return self
получившийся объект Markup
- static process_text(*args, **kw)¶
- class rupo.main.markup.Syllable(begin: int, end: int, number: int, text: str, stress: int = - 1)[source]¶
Bases:
Annotation
Разметка слога. Включает в себя аннотацию и номер слога, а также ударение. Если ударение падает не на этот слог, -1.
- class rupo.main.markup.Word(begin: int, end: int, text: str, syllables: List[Syllable])[source]¶
Bases:
Annotation
Разметка слова. Включает в себя аннотацию слова и его слоги.
- get_stressed_syllables_numbers() List[int] [source]¶
- Returns
номера слогов, на которые падают ударения.
rupo.main.test_markup module¶
- class rupo.main.test_markup.TestMarkup(methodName='runTest')[source]¶
Bases:
TestCase
- classmethod setUpClass()[source]¶
Hook method for setting up class fixture before running tests in the class.
rupo.main.test_tokenizer module¶
rupo.main.test_vocabulary module¶
rupo.main.tokenizer module¶
- class rupo.main.tokenizer.Token(text: str, token_type: TokenType, begin: int, end: int)[source]¶
Bases:
object
rupo.main.vocabulary module¶
- class rupo.main.vocabulary.StressVocabulary[source]¶
Bases:
object
Индексированный словарь.
- add_markup(markup: Markup) None [source]¶
Добавление слов из разметки в словарь.
- Parameters
markup – разметка.
- add_word(word: StressedWord, index: int = - 1) bool [source]¶
Добавление слова.
- Parameters
word – слово.
index – индекс, если задан заранее.
- Returns
слово новое или нет.
- get_word(index: int) StressedWord [source]¶
Получить слово по индексу.
- Parameters
index – индекс.
- Returns
слово.