Мэдээллийн хайлт
Мэдээлэл гаргаж авах (англ. information retrieval) гэдэг бол мэдээллийн нөөцийн цуглуулгаас шаардагдах мэдээлэлтэй хамааралтай мэдээллийн нөөцийг олж авах үйл ажиллагаа юм. Хайлт нь бүтэн бичвэр эсвэл бусад агуулгад суурилсан индексжүүлэлтэд суурилж болно. Мэдээлэл хайх гэдэг бол баримт бичиг хайх, баримт бичиг дотроос мэдээлэл хайх, түүнчлэн өгөгдөл, бичвэрэн өгөгдлийн хөмрөг, зураг, дуу мэтийг тайлбарласан мета өгөгдлийг хайх шинжлэх ухаан юм.
Мэдээлэл хайх автоматжуулсан системийг мэдээллийн халилтыг багасгахад ашигладаг. Олон их сургууль, нийтийн номын сан IR буюу мэдээлэл хайх системийг ашиглан ном, сэтгүүл болон бусад баримт бичгийг хэрэглэх боломжоор хангадаг.
Тойм
[засварлах | кодоор засварлах]Хэрэглэгчээс систем рүү квери (англ. query) оруулснаар мэдээлэл хайх үйл явц эхэлдэг. Квери гэдэг бол вэб хайлтын системд байдаг тэмдэгт мөр буюу стринг шиг шаардлагатай мэдээлэлд зориулсан албан мэдэгдэл юм. Квери нь тухайн цуглуулга дотроос цор ганц объектийг таньж олдоггүй. Харин тухайн кверитэй хамаарлын ялгаатай түвшнүүдэд таарах олон объектийг олох боломжтой.
Объект гэдэг бол агуулгын цуглуулга буюу өгөгдлийн хөмрөг дотор буй мэдээллээр төлөөлөгдсөн энтити юм. Хэрэглэгчийн квери нь өгөгдлийн хөмрөгийн мэдээлэлтэй харьцуулагдана. Гэвч өгөгдлийн хөмрөгийн сонгодог SQL кверитэй харьцуулахад мэдээлэл хайлтын үр дүн кверитэй таарах албагүй учир үр дүн нь ихэвчлэн чансаагаараа эрэмбэлэгдсэн байдаг. Энэхүү чансаа нь өгөгдлийн хөмрөгийн хайлт болон мэдээлэл хайлтын хоорондох гол ялгаа юм.
Хэрэглээнээс хамааран өгөгдлийн объект нь баримт бичиг, зураг, аудио, оюуны зураглал, видео гэх мэт олон янз байж болно. Баримт бичгүүдийг ихэвчлэн мэдээлэл хайлтын системд шууд хадгалдаггүй. Харин баримт бичгийн орлуулга буюу мета өгөгдлөөр төлөөлүүлсөн байдаг.
Ихэнх мэдээлэл хайлтын систем тухайн өгөгдлийн хөмрөг доторх объект бүр тухайн кверитэй хэр сайн таарч байгаад оноо өгч тооцоолдог. Топ чансаатай объектуудыг хэрэглэгчид харуулна. Хэрэв хэрэглэгч кверигээ боловсронгуй болгохыг хүсвэл дээрх үйл явцыг дахин давтана.
Түүх
[засварлах | кодоор засварлах]Загварын төрлүүд
[засварлах | кодоор засварлах]Мэдээлэл хайлтын стратегиудыг ашиглан хамааралтай баримт бичгүүдийг үр нөлөөтэйгөөр хайхын тулд тухайн баримт бичгүүдийг ихэвчлэн зохих төлөөлөл рүү нь хувиргадаг. Хайлтын стратеги бүр өөрийнхөө баримт бичгийг төлөөлөх зорилгоор тодорхой загварыг өөртөө хамруулдаг. Баруун талд байгаа зурагт зарим нийтлэг загварыг харуулав. Зурагт буй загваруудыг дараах хоёр хэмжээсээр айжуулав: математикийн суурь ба тухайн загварын шинж чанар.
Нэмж унших
[засварлах | кодоор засварлах]- Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Modern Information Retrieval: The Concepts and Technology behind Search (second edition). Addison-Wesley, UK, 2011.
- Stefan Büttcher, Charles L. A. Clarke, and Gordon V. Cormack. Information Retrieval: Implementing and Evaluating Search Engines. MIT Press, Cambridge, Mass., 2010.
- Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schütze. Introduction to Information Retrieval. Cambridge University Press, 2008.
Цахим холбоос
[засварлах | кодоор засварлах]- ACM SIGIR: Information Retrieval Special Interest Group
- BCS IRSG: British Computer Society - Information Retrieval Specialist Group
- Text Retrieval Conference (TREC)
- Forum for Information Retrieval Evaluation (FIRE)
- Information Retrieval (online book) by C. J. van Rijsbergen
- Information Retrieval Wiki
- Information Retrieval Facility
- Information Retrieval @ DUTH
- TREC report on information retrieval evaluation techniques
- How eBay measures search relevance
- Information retrieval performance evaluation tool @ Athena Research Centre