Jump to content

Дамерау-Левенштейны засварын зай

Википедиа — Чөлөөт нэвтэрхий толь

Эх хэлний боловсруулалтын салбарт доорх засварын үйлдлүүдийг хэдэн удаа ашиглан нэг тэмдэгт мөрийг нөгөө тэмдэгт мөр болгон хувиргаж болохыг Дамерау-Левенштейны зай (Damerau–Levenshtein distance) гэдэг:

  • Оруулах
  • Устгах
  • Орлуулах
  • Хөрш хоёр үсгийг солих

Уг ойлголтыг үгийн бичлэгийн алдаа засах асуудалд өргөн ашигладаг.

Доорх хүснэгтэнд зөвшөөрөгдөх үйлдлүүдийн жишээг үзүүлэв:

Дамерау-Левенштейны үйлдлүүдийн жишээ
Алдаатай үг Засах хувилбар Зөв үсэг Алдаатай үсэг Үйлдлийн төрөл
хамад хамаг г д орлуулах
хамад хаад - м оруулах
хамад хамаад а - устгах
хамад ахмад ха ах хөрш хоёр үсгийг солих

Машин сургалтанд алдаа засах асуудлыг шийдэх үед ихэвчлэн дайралддаг алдаануудын жагсаалт хэрэг болдог ба англи хэлний хувьд ийм жагсаалтын жишээ нь Питер Норвигийн үүсгэсэн Дамерау-Левенштейний 1 зайтай алдааны жагсаалт юм (http://norvig.com/ngrams/spell-errors.txt).