rupo.main package¶
Submodules¶
rupo.main.markup module¶
-
class
rupo.main.markup.Annotation(begin: int, end: int, text: str)[source]¶ Bases:
rupo.util.mixins.CommonMixinКласс аннотации. Содержит начальную и конечную позицию в тексте, а также текст аннотации.
-
class
rupo.main.markup.Line(begin: int, end: int, text: str, words: List[rupo.main.markup.Word])[source]¶ Bases:
rupo.main.markup.AnnotationРазметка строки. Включает в себя аннотацию строки и её слова.
-
class
rupo.main.markup.Markup(text: str = None, lines: List[rupo.main.markup.Line] = None)[source]¶ Bases:
rupo.util.mixins.CommonMixinКласс данных для разметки в целом с экспортом/импортом в XML и JSON.
-
from_raw(text: str) → rupo.main.markup.Markup[source]¶ Импорт из сырого текста с ударениями в конце слов
Parameters: text – текст. Returns: разметка.
-
from_xml(xml: str) → rupo.main.markup.Markup[source]¶ Импорт из XML.
Parameters: xml – XML-разметка Return self: получившийся объект Markup
-
static
process_text(*args, **kw)¶
-
-
class
rupo.main.markup.Syllable(begin: int, end: int, number: int, text: str, stress: int = -1)[source]¶ Bases:
rupo.main.markup.AnnotationРазметка слога. Включает в себя аннотацию и номер слога, а также ударение. Если ударение падает не на этот слог, -1.
-
class
rupo.main.markup.Word(begin: int, end: int, text: str, syllables: List[rupo.main.markup.Syllable])[source]¶ Bases:
rupo.main.markup.AnnotationРазметка слова. Включает в себя аннотацию слова и его слоги.
-
get_stressed_syllables_numbers() → List[int][source]¶ Returns: номера слогов, на которые падают ударения.
-
rupo.main.test_markup module¶
rupo.main.test_tokenizer module¶
rupo.main.test_vocabulary module¶
rupo.main.tokenizer module¶
-
class
rupo.main.tokenizer.Token(text: str, token_type: rupo.main.tokenizer.Token.TokenType, begin: int, end: int)[source]¶ Bases:
object