Jump to content

Мэдээллийн хайлт

Википедиа — Чөлөөт нэвтэрхий толь
(Мэдээлэл хайлт-с чиглүүлэгдэв)

Мэдээлэл гаргаж авах (англ. information retrieval) гэдэг бол мэдээллийн нөөцийн цуглуулгаас шаардагдах мэдээлэлтэй хамааралтай мэдээллийн нөөцийг олж авах үйл ажиллагаа юм. Хайлт нь бүтэн бичвэр эсвэл бусад агуулгад суурилсан индексжүүлэлтэд суурилж болно. Мэдээлэл хайх гэдэг бол баримт бичиг хайх, баримт бичиг дотроос мэдээлэл хайх, түүнчлэн өгөгдөл, бичвэрэн өгөгдлийн хөмрөг, зураг, дуу мэтийг тайлбарласан мета өгөгдлийг хайх шинжлэх ухаан юм.

Мэдээлэл хайх автоматжуулсан системийг мэдээллийн халилтыг багасгахад ашигладаг. Олон их сургууль, нийтийн номын сан IR буюу мэдээлэл хайх системийг ашиглан ном, сэтгүүл болон бусад баримт бичгийг хэрэглэх боломжоор хангадаг.

Хэрэглэгчээс систем рүү квери (англ. query) оруулснаар мэдээлэл хайх үйл явц эхэлдэг. Квери гэдэг бол вэб хайлтын системд байдаг тэмдэгт мөр буюу стринг шиг шаардлагатай мэдээлэлд зориулсан албан мэдэгдэл юм. Квери нь тухайн цуглуулга дотроос цор ганц объектийг таньж олдоггүй. Харин тухайн кверитэй хамаарлын ялгаатай түвшнүүдэд таарах олон объектийг олох боломжтой.

Объект гэдэг бол агуулгын цуглуулга буюу өгөгдлийн хөмрөг дотор буй мэдээллээр төлөөлөгдсөн энтити юм. Хэрэглэгчийн квери нь өгөгдлийн хөмрөгийн мэдээлэлтэй харьцуулагдана. Гэвч өгөгдлийн хөмрөгийн сонгодог SQL кверитэй харьцуулахад мэдээлэл хайлтын үр дүн кверитэй таарах албагүй учир үр дүн нь ихэвчлэн чансаагаараа эрэмбэлэгдсэн байдаг. Энэхүү чансаа нь өгөгдлийн хөмрөгийн хайлт болон мэдээлэл хайлтын хоорондох гол ялгаа юм.

Хэрэглээнээс хамааран өгөгдлийн объект нь баримт бичиг, зураг, аудио, оюуны зураглал, видео гэх мэт олон янз байж болно. Баримт бичгүүдийг ихэвчлэн мэдээлэл хайлтын системд шууд хадгалдаггүй. Харин баримт бичгийн орлуулга буюу мета өгөгдлөөр төлөөлүүлсөн байдаг.

Ихэнх мэдээлэл хайлтын систем тухайн өгөгдлийн хөмрөг доторх объект бүр тухайн кверитэй хэр сайн таарч байгаад оноо өгч тооцоолдог. Топ чансаатай объектуудыг хэрэглэгчид харуулна. Хэрэв хэрэглэгч кверигээ боловсронгуй болгохыг хүсвэл дээрх үйл явцыг дахин давтана.

Загварын төрлүүд

[засварлах | кодоор засварлах]
Мэдээлэл хайлтын айжуулалт

Мэдээлэл хайлтын стратегиудыг ашиглан хамааралтай баримт бичгүүдийг үр нөлөөтэйгөөр хайхын тулд тухайн баримт бичгүүдийг ихэвчлэн зохих төлөөлөл рүү нь хувиргадаг. Хайлтын стратеги бүр өөрийнхөө баримт бичгийг төлөөлөх зорилгоор тодорхой загварыг өөртөө хамруулдаг. Баруун талд байгаа зурагт зарим нийтлэг загварыг харуулав. Зурагт буй загваруудыг дараах хоёр хэмжээсээр айжуулав: математикийн суурь ба тухайн загварын шинж чанар.