среда, 13 мая 2009 г.

Оценка вероятности правильности использования синонима

Заменяемо слово (ЗС) – это слово, которое мы пытаемся заменить на синоним (Син).

Связанным словом назовем, слово которое в предложении имеет самую близкую связь с проверяемым на синоним. Связанное слово (СС) по возможности должно нести максимальную роль (глагол и существительное). Красный петух клевал зерно, постукивая клювом. В этом предложении связанные слова стоят сразу после слова. Только СС слова “зерно” - “клевал”.

Проверка следующая:

Пусть есть БД (текстов, директ) из базы узнаем, сколько раз встречается ЗС = N(ЗС), синоним N (Син). Если слова аналогичны по смыслу в этой ситуации, то при идеальных условиях:

N(Син)/N(ЗС)= N(Син+СС)/N(ЗС+СС)

Где N (X+Y) , частота встреч X и Y в одном предложении или запросе.
Если N(Син)/N(ЗС) <>

F = N(Син+СС)/N(ЗС+СС) - N(Син)/N(ЗС);

Чем выше значение функции, тем больше вероятность. Выберем функцию оценки вероятности от F - P(F). F->0 P->0, F->@ (бесконечность), P->1.

P – всюду возрастающая. Из этих соображений легко найти функцию вероятности. Удачи.

Пусть P0 – среднее P, Средняя вероятность, что синоним подойдет. При небольшом количестве экспериментов (малых значениях N(Син+СС), N(ЗС+СС), N(Син) и N(ЗС)) Функцию необходимо усреднить к P0.

Можно выбирать не одно а несколько СС, учитывая численно меру их связи.



Запчасти Opel Dello: масло для дерева . Краски Manor Hall (PPG) из США.