Паттерны поведения
.alternation ::= expression 'Г expression
sequence ::= expression '&' expression
repetition ::= expression 'repeat'
literal ::= 'a
1
| 'b' | 'c
1
| ... { 'a
1
I 'b
1
I 'c' I ... }*
Между этой грамматикой и той, что приведена в разделе «Мотивация», есть
небольшие отличия. Мы слегка изменили синтаксис регулярных выражений, по-
скольку в Smalltalk символ * не может быть постфиксной операцией. Поэтому
вместо него мы употребляем слово repeat. Например, регулярное выражение
( ( ' d o g ' | 'cat ') repeat & 'weather')
соответствует входной строке 'dog dog cat weather'.
Для реализации программы сопоставления мы определим пять классов, упо-
мянутых на стр. 237. В классе SequenceExpression есть переменные экземпля-
ра expression1 и expression2 для хранения ссылок на потомков в дереве.
Класс AlternationExpression хранит альтернативы в переменных экземпляра
alternativel и alternative2, а класс RepetitionExpression - повторяемое
выражение в переменной экземпляра repetition. В классе LiteralExpression
есть переменная экземпляра components для хранения списка объектов (скорее
всего, символов), представляющих литеральную строку, которая должна соответ-
ствовать входной строке.
Операция match: реализует интерпретатор регулярных выражений. В каж-
дом из классов, входящих в абстрактное синтаксическое дерево, эта операция ре-
ализована. Ее аргументом является переменная inputState, описывающая те-
кущее состояние процесса сопоставления, то есть уже прочитанную часть входной
строки.
Текущее состояние характеризуется множеством входных потоков, представ-
ляющим множество тех входных строк, которое регулярное выражение могло бы
к настоящему моменту принять. (Это примерно то же, что регистрация всех со-
стояний, в которых побывал бы эквивалентный конечный автомат, распознавший
входной поток до данного места.)
Текущее состояние наиболее важно для операции repeat. Например, регу-
лярному выражению
1
а' repeat
интерпретатор сопоставил бы строки
"а", "
аа", "ааа" и т.д. А регулярному вы-
ражению
1
а' repeat & ' be '
строки " abc", " aabc", " aaabc" и т.д. Но при наличии регулярного выражения
'а' repeat & 'abc'
сопоставление входной строки "aabc" с подвыражением " ' a ' repeat" дало
бы два потока, один из которых соответствует одному входному символу, а дру-
гой - двум. Из них лишь поток, принявший один символ, может быть сопостав-
лен с остатком строки " abc".
Do'stlaringiz bilan baham: |