Jump to content

Бүтээлийн хулгай: Засвар хоорондын ялгаа

Википедиа — Чөлөөт нэвтэрхий толь
Content deleted Content added
Мөр 54: Мөр 54:
Энгийн боловч үр ашиггүй арга замыг харья нэг мөр нь нөгөөхийн дотор хаана нь тохирч байгааг мэдэхийн тулд тус бүрээр нь шалгана. Тэгэхээр нэг 9бүхэл8эхийн эхний үг нь хуулбар байна уу гэдгийг бид эхлээд харна, хэрэв үгүй бол бид энэ эхийн хоёр дахь үгийг нь мөн хуулбар эсэхийг харна, хэрэв тийм биш бол бид гурав дахь, дөрөв дэх үгийг хархаар эхлэх гэх мэт. Хэвийн тохиолдолд бид тэр эхийн нэг дэх хоёр дахь үгийг нь хараад энэ үг нь буруу байрлалтай гэдгийг нь мэднэ, дундаж тохиолдолд O(n+m) –ийм үйлдэл гаргадаг, n-нь эхийн урт m-нь үгийн урт, гэхдээ хамгийн муу тохиолдолд "aaaaaaaaab" шиг үгээс "aaaab" шиг үгийг хайхад, энэ нь O (nm) авдаг.
Энгийн боловч үр ашиггүй арга замыг харья нэг мөр нь нөгөөхийн дотор хаана нь тохирч байгааг мэдэхийн тулд тус бүрээр нь шалгана. Тэгэхээр нэг 9бүхэл8эхийн эхний үг нь хуулбар байна уу гэдгийг бид эхлээд харна, хэрэв үгүй бол бид энэ эхийн хоёр дахь үгийг нь мөн хуулбар эсэхийг харна, хэрэв тийм биш бол бид гурав дахь, дөрөв дэх үгийг хархаар эхлэх гэх мэт. Хэвийн тохиолдолд бид тэр эхийн нэг дэх хоёр дахь үгийг нь хараад энэ үг нь буруу байрлалтай гэдгийг нь мэднэ, дундаж тохиолдолд O(n+m) –ийм үйлдэл гаргадаг, n-нь эхийн урт m-нь үгийн урт, гэхдээ хамгийн муу тохиолдолд "aaaaaaaaab" шиг үгээс "aaaab" шиг үгийг хайхад, энэ нь O (nm) авдаг.
== Эшлэл==
== Эшлэл==
{{reflist|30em|refs=
<ref name="Abdelmoneim">{{cite web |title=Plagiarism What is it? How to avoid it? |last=Abdelmoneim |first=Salah-Eldin |work=14th Alexandria Anaesthesia & Intensive Care Conference
<ref name="Abdelmoneim">{{cite web |title=Plagiarism What is it? How to avoid it? |last=Abdelmoneim |first=Salah-Eldin |work=14th Alexandria Anaesthesia & Intensive Care Conference
|publisher=Alexandria Faculty of Medicine |date=September 30, 2010 |url=http://www.alexaic.com/alexaicfiles/presentation2010/day3/028001.pdf }}</ref>
|publisher=Alexandria Faculty of Medicine |date=September 30, 2010 |url=http://www.alexaic.com/alexaicfiles/presentation2010/day3/028001.pdf }}</ref>

<ref name="Koovakkai">{{cite web |title=Diagnosing Plague: Tools And Techniques For Detecting Plagiarism |last=Koovakkai |first=Dineshan |work=8th International CALIBER - 2011, Goa University, Goa |date=March 2–4, 2011 |publisher=INFLIBNET Centre, Ahmedaba, India |url=http://shodhganga.inflibnet.ac.in/dxml/bitstream/handle/1944/1629/37.pdf?sequence=1 }}</ref>
<ref name="Koovakkai">{{cite web |title=Diagnosing Plague: Tools And Techniques For Detecting Plagiarism |last=Koovakkai |first=Dineshan |work=8th International CALIBER - 2011, Goa University, Goa |date=March 2–4, 2011 |publisher=INFLIBNET Centre, Ahmedaba, India |url=http://shodhganga.inflibnet.ac.in/dxml/bitstream/handle/1944/1629/37.pdf?sequence=1 }}</ref>


Мөр 458: Мөр 456:
| url=http://archive.plagiarismadvice.org/images/stories/old_site/media/2008papers/P21%20Weber-Wulff.pdf
| url=http://archive.plagiarismadvice.org/images/stories/old_site/media/2008papers/P21%20Weber-Wulff.pdf
}}</ref>
}}</ref>

}}<!-- closure for refs= -->

02:27, 19 Дөрөвдүгээр сар 2017-ий байдлаарх засвар

Бүтээлийн хулгай (Плагиат. Plagiarism. Plagiary). Латины plagio – “хулгайлана” гэсэн утгатай үг. Бусдын бүтээлийг зохиогчийн зөвшөөрөлгүйгээр бүхэлд нь болон хэсэгчлэн авч өөрийн нэрээр гаргахыг бүтээлийн хулгай буюу плагиат гэж нэрлэдэг. Заримдаа үүнийг оюуны хулгай гэж нэрлэдэг тохиолдол ч бий. Бусдын бүтээлийг бүхэлд нь буюу ихэнх хэсгийг, эсвэл гол үндэслэлийг санаатайгаар ашиглаж, өөрийн болон гурав дахь хүний нэрээр гаргахыг оюуны хулгай буюу эрүүгийн гэмт хэрэг гэж үздэг. Зохиогчийн эрхийг зөрчсөн аливаа үйлдлийг хуулиар зохицуулдаг бөгөөд шүүхийн шийдвэрээр зохиогчийн жинхэнэ нэрийг сэргээхийн хамт зөвшөөрөлгүй бүтээлийг хэвлэн тараахыг хориглож, зохиогчийн хүсэлтээр залруулга, тодруулга хийх, өөрчлөлт оруулах, зохиогчид болон түүний өв залгамжлагчид учирсан эд хөрөнгийн хохирлыг нөхөн төлүүлэх болно. Харин иргэдээс нийгмийн хүртээл болсон бүтээлийг зохиогчийн зөвшөөрөлгүй, үнэ хөлс төлөхгүйгээр өрх гэрийнхээ хүрээнд ашиглах явдлыг зохиогчийн эрхийн тухай хууль тогтоомж зөрчсөн гэж үзэх үндэслэлгүй юм.

Хэн нэгэн хэзээ ч бусдын контэнт, мэдээ мэдээллийг хялбархан хуулж, хувилж чадна. Үүнийг санаа болон бүтээлийн хулгай (plagiarism) гэж хэлдэг. Энэ нь одоо үед ихсэж байна. Цахим баримт бичгүүд нь хууль бусаар хуулбарлагдах аюултай. Хүмүүс ихэвчлэн баримт бичгийг дуурайлган бичих, хуулбарлах, хаанаас иш татсан нь тодорхойгүй байдаг. Технологийн дэвшил нь цахим номын санг бололцоотой болгосон юм. Интернетээр болон Netscape гэх мэт чиглүүлэгчд ийн хэрэглээний өсөлтөөр хэрэглээ нь нэмэгдсэн. Гэсэн хэдий ч эдгээр нь хууль бусаар хуулбарлаж, түгээх аюулыг ихэсгэдэг. Одоогийн технологи нь оюуны өмчийг хамгаалах зохистой хамгаалалт үзүүлдэггүй. Үүний улмаас мэдээлэл түгээгчид ихэвчлэн IEEEE-гээс гаргадаг CD-ROM гэх мэт хаалттай системүүдийг ашиглан үнэ цэнэтэй мэдээлэл түгээх хандлагатай байдаг болсон. Шинэ технологийн тусламжтайгаар хэрэглэгчдийг мэдээллийн урсгалаас чөлөөтэй мэдээлэл авах бололцоог бүрдүүлж, мөн тэдний хууль бусаар мэдээллээ хуулбарлаж түгээхийг зогсоох нь чухал. Энэ асуудлыг шийдвэрлэж болох нэг арга нь оригинал document-ийг бүртгэж, хуулбаруудыг илрүүлэх боломжтой хуулбар илрүүлэх үйлчилгээ нэвтрүүлэх юм. Ихэнх хуулбар илрүүлэгч системүүд нь өгүүлбэрт тулгуурласан харьцуулалтын аргаар боломжит хуулбарласан бүтээгдэхүүнийг бүх бүртгэлтэй document-уудтай харьцуулж хуулбарлалтыг илрүүлдэг. Шууд хуулбарласан, хуулаагүйг нь мэдэхэд хэцүү байдаг, үүнийг мэдэхийн тулд “plagiarism” ийг хэрэглэж байна. Одоо байгаа механизмуудын хамгаалалтын төвшин нь сул, хуулбарласан документ нь илрүүлэлтийг өгүүлбэртээ хэдхэн өгүүлбэрт бага зэрэг өөрчлөлт оруулаад л давтах боломжтой. Ерөнхийдөө эхлээд баримт бичгийг индекс хийж үүнийгээ өмнө нь бүртгэгдсэн, хадгалагдсан бусад баримтуудтай харьцуулж ажилладаг.

АРГA ХЭЛБЭРҮҮД

Хэлбэрүүд

  1. Text Based
  2. Attribute-oriented code-based
  3. Structure-oriented code-based system

Текст дээр суурилсан

Үг өгүүлбэр дээр тоололт хийж, баримт бичиг нь plagiarized байгаа эсэхийг шалгадаг. Олон үг давтагдах тусам ижилхэн байгааг нь илтгэнэ. Энэ арга нь их баримт бичиг дотор хэсэг текст нь бүхлээрээ хуулагдсан байх үед сул талтай. Энэ бүтэц нь 4 хэсгээс бүрддэг цуглуулга(collection), дүн шинжилгээ(analysis), бүтэц, хэлбэр(conformation), шалгалт, судалгаа(investigation).

Attribute-oriented code-based

Энэ нь зөвхөн гол код болон чанарын тодорхойлолт дээр үнэлгээ хийдэг. Аттрибутуудийн хоорондох ялгаагаар ил байнгаа эсэхийг шалгадаг. Гэхдээ энэ нь тийм сайн арга биш, хэн нэгэн кодыг нь хуулан аваад хувьсагчийн нэрийг нь сольсон бол үүнийг нь шалгадаггүй. Мөн энэ нь том хэмжээний код дээр шалгалт хийхэд мөр мөрөөр нь шалгадаг тул их хугацаа шаардана.

Structure-oriented code-based system

Энэ нь дээр байгаа 2 төрлийн хослол. Текстэн болон бүтэц аль алинд нь анхаардаг. Жижиг хэсэгт хүртэл хувьсагчийн өөрчлөлт, тайлбар болон бүх бүтцийн хувьд анхаардаг. Энэ нь нөгөө 2 аргаас илүү хэрэгцээтэй юм.

Existing Approaches

Одоо байгаа аргууд нь 2 ангид хуваагддаг.

  • Extrinsic methods
  • Intrinsic methods

Extrinsic methods ерөнхийдөө сэжигтэй болон жинхэнэ баримт бичгийн харьцуулалт байдаг. Intrinsic нь өөр баримттай харьцуулалт хийдэггүй, хэл шинжлэх арга шиг. Энэ нь үгийн санг ерөнхийдөө хардаг. Догол мөрийн дундаж урт, онцлог үгийн давтамж. Адил байгаа эсэхийн үзүүлэлт нь өөр өөр хэмжигдэхүүн дээр байдаг. Баримт бичгээс нь шалтгаалан нэг эсвэл олон хэмжээс гэж ангилдаг.

ХАРЬЦУУЛАХ АРГУУД НЬ

Хуулбарлагдсан байх магадлалтай document бүртгэгдсэн документ-тэй харьцуулагдахад бид документ-ийн утгыг тогтоохын тулд мэдээлэл эргүүлж авах аргууд ашигладаг. Энэ арга нь нэгж болон бүлэг документ-уудыг хянахад ашигладаг. Өөрөөр хэлбэл 2 адилхан утга илэрхийлж байгаа зүйлийг олохдоо үүнийг ашигладаг. Өгүүлэгдэхүүн бүр нүүр нүүрээр нарийн харьцуулагдаж зарим өгүүлэгдэхүүн нь таарч байгаа эсэхийг харна. Адил талтай документ-уудыг судалснаар хэрэглэгчид хуулбар илрүүлэх системийг ердөө өгүүлбэрт одоо цаг болгон өөрчлөх гэх мэтээр бага зэргийн өөрчлөлт хийгээд давах боломжгүй гэсэн үг.

String matching procedures

Энэ нь хамгийн урт адилхан байгаа текстийг хардаг. Үүнээс төвшин нь шийдэгддэг. Төвшинг нь давах үед энэ өгөгдөл нь хулгайлагдсан байна гэж үзүүлнэ. Дагавар сольж бичсэн аргууд(Suffix tree), мөн массив, болон хуулсан мэдээллээ далдал нуусан үед илрүүлэх хэцүү.

Vector space based

Энэ нь бүх баримт бичигт бичигдсэн нэр томьёнуудийг илүүд үзэн хардаг, үүгээрээ эцсийн үр дүнг гаргадаг. Косинусийн хэмжээг ижил эсэхийг шалгахад ашигладаг. Үгийг ойролцоо, симантик мөн бусад өөрчлөгдсөн нэр томьёог шалгаж чадна.

Fingerprinting

Энэ нь текстээс олон дэд хэсгүүдийг сонгон хардаг. Дэд хэсгүүдийг fingerprint-үүд гэж хэлдэг мөн элементүүдийг нь minutiae гэж нэрлэдэг. Hash функц нь minutiae-ийг харьцуулахад хялбар string төрөл рүү хөрвөдөг. Query ашиглан minutiae бүрийг индекс хийсэн баримттай тулгадаг.

ХАМААРАЛТАЙ АЖИЛУУД

Одоо ашиглагдаж буй оюуны өмчийг хамгаалах аргууд нь хуулбарлалтаас сэргийлэх болон хуулбарлалт илрүүлэх гэсэн хоёр төрлийн механизмд хамаарна. Хуулбарлалтаас сэргийлэх аргууд нь мэдээллийг зөвхөн зөвшөөрөлтэй хэрэглэгчдэд ашиглах боломжтой болгодог, үүрэг нь документ-уудыг тараахыг нь аль болох барьж байхад оршино.

Хуулбарлалтаас сэргийлэх нэг арга нь “хамгаалалттай принтер”-т суурилсан байдаг. Хэрэглэгч нь мэдээлэл нийлүүлэгчээс document хүссэн үед нийлүүлэгч эхлээд тухайн хэрэглэгч нь документ-ийг ашиглах эрхтэй эсэхийг шалгадаг. Тэрний дараа документ нь олон нийтийн түлхүүрээр кодлогдоно. Кодолсон document ашиглах эрхтэй хэрэглэгчрүү дамжуулагдаж, хэрэглэгч кодыг тайлах тусгай түлхүүртэй принтерээр хэвлэнэ. Тусгай эрхгүй хэрэглэгч нь хулгайлагдсан документ-ийг хэвлэх боломжгүй. Энэхүү системийн сул тал нь хэрэглэгчид документ-ийн талаар тодорхой мэдлэгийг худалдаж авахаасаа өмнө олж авах боломжгүйд оршино.

Хуулбарлалтаас сэргийлэх бас нэгэн арга нь “Идэвхтэй документ”-д суурилсан байдаг. Хэрэглэгчрүү документ-ийг явуулахын оронд мэдээлэл нийлүүлэгч хамгаалалттай документ эвлүүлэх чадвартай document үүсгэгч программруу явуулдаг. Үүнээс гадна документ -ийг ашиглах үед программ мэдээлэл нийлүүлэгчрүү баталгаажуулалт явуулдаг. Энэ арга нь мэдээлэл нийлүүлэгчид document-ийн хэрэглэгч нь эзэмшигчийн эрхтэй эсэхийг шалгахад тусалдаг. Хуулбарлалтаас сэргийлэх системүүдийн үүрэг нь документ-ийг ашиглаж байгаа хэрэглэгч тусгай эрхтэй эсэхийг шалгахад байгаа юм. Хэрэглэгч хууль ёсны хуулбар авсныхаа дараа тухайн документ-ийн хууль бусаар хуулбарлахын эсрэг арга хэмжээнүүд байдаггүй. Үүнээс гадна документ -хэсгээс тасалж аваад хууль бусаар хуулбарлахыг хуулбарлалтын эсрэг программаар зогсоох боломжгүй.

Хуулбарлахаас сэргийлэх программуудыг бодвол хуулбарлалт илрүүлэх программууд илүү чөлөөтэй. Xуулбарлалт илрүүлэх программууд нь хууль бусаар хуулбарлаж нийлүүлэхийн эсрэг арга хэмжээ авдаг. Хуулбарлалт илрүүлэх нэг арга нь хэрэглэгчид өгч байгаа документ-уудыг тэмдэглэж байдаг, энэ тэмдэг нь документ-ийг ашиглаж байгаа хэрэглэгчийг таньдаг. Хэрэв документ-ийг цахим хэлбэрээр хуулбарлагдаж, эсвэл оригинал хувилбарыг оригинал хэрэглэгчээс өөр хүн ашиглаж байгаа нь илэрвэл гэрээ зөрчсөн үйлдэл болж, үүнийг нь тэмдэг нь илрүүлнэ. Энэхүү тэмдэглэгээний гол сул тал нь JPEG-рүү шилжүүлэх гэх мэт “ шахах ” үйлдэл хийвэл тэмдэглэгээ нь арилдаг. Мөн хэсэгчилсэн хуулбарлалтыг тэмдэглэгээгээр илрүүлэх боломжгүй. Энэхүү тэмдэглэгээ хуулбарлалт илрүүлдэг нь нэгэн төрлийн хүний оролцоогүй систем юм.

Анхны идэвхтэй хуулбарлалт илрүүлэгч программууд нь ихэвчлэн программчлалд явагдаж буй хуулбарлалтыг илрүүлэхэд оршдог байсан. Оюутан сурагчид Pascal юм уу C программыг нэг нэгнээсээ хуулж магадгүй. Үүнийг илрүүлэхийн тулд систем нь бүх сэтгэгдэл, хоосон зайнуудыг арилгаад, бүх таних тэмдэгтүүдийг тоогоор орлуулдаг. Хамгийн энгийн программуудаар бага зэргийн өөрчлөлт оруулж хуулбарласан тохиолдолд тэдгээрийг илрүүлээд төсөөтэй хэсгүүдээр хуулж олж болно. Өөрчлөлт орсон байж магадгүй хэмжээ, байрлал, хувилбаруудыг статистикчлаад олох боломжтой. Бусад аргууд нь программын хэр их ажиллагаа шаардсан байгааг тооцоолж болдог. Хоорондоо хэт төстэй программууд энэхүү тооцоонд заагдсан хэмжээнээс хэтэрвэл тэдгээрийг тэмдэглэж хэрэглэгчийг нь хууль бусаар хуулбарласан эсэхийг шалгана. Документ-уудад зориулсан санаануудын хуулбарласан эсэхийг шалгадаг систем нь программын хуулбарлалт шалгадаг системүүдийг өргөн цар хүрээтэй болгож ашигладаг. Компьютерын программууд нь бүтэц сайтай байдаг бөгөөд үйл явцууд , нэмэлтүүд нь программын бүтцийг харуулдаг. Хуулбарлагдсан ч бай хийх ёстой үйлдлээ хийхийн тулд оригиналийн бүтэц үйл явцыг аль болох өөрчлөөгүй байдаг. Үүнтэй адилаар хуулсан программнууд харагдах байдлаараа олон өөрчлөлт орсон ч гэсэн хийж буй үйлдэл нь оригиналтайгаа яг адилхан байж болдог. Хэсэг , бүтэц, үйл явцыг хадгалсан программ өөр бүтэц үйл явцтай документ ч байсан яг адилхан хэвтэй байж болно. Харин үг ,өгүүлбэрт суурилсан систем нь эсрэгээрээ . Учир нь үг, өгүүлбэрийг нь идэвхтэйгээс, идэвхгүй болговол систем, хуулбарлалт илрүүлэгчийг хуурч болно.

CHECK-ийн дэд бүтэц

Энэхүү хуулбарлалт илрүүлэх программын дэлгэрэнгүй дэд бүтэц нэгдүгээр зурагд дүрсэлж харуулсан байгаа. Хүснэгтэд харуулснаар CHECK гурван үндсэн бүтэцтэй : Document бүртгэгч, document харьцуулагч, document зохицуулалт. Document бүртгэгч анхдагч document-ийг анхдагч гэж үздэг, хэсэг бүлэг document агуулсан database server-т бүртгэдэг. Document харьцуулагч нь оруулсан document-ийн бүртгэгдсэн document-уудтай харьцуулж хууль бусаар хуулбарласан шинж тэмдэг байгаа эсэхийг шалгадаг. Document зохицуулалт нь document болгоныг дотроо нууцалж хадгалан document-ийн бүртгэл харьцуулалттай нягт холбоотой ажилладаг. CHECK системд Oracle database зохицуулалтын систем байгуулдаг. Системийн 3 хэсэг нь 3 энгийн үйлдэлтэй : Анхдагч document-ийн бүртгэл, document баталгаажуулалт, энгийн document-ийн бүртгэл.

  1. Анхдагч document-йин бүртгэл : анхдагч хэмээн үзэж байгаа document-аа CHECK систем бүртгэдэг. Ингэснээр document бүртгэлийн хэсэг document зохицуулалтын хэсгийг идэвхжүүлж document-ийн Oracle database-д нөөцөлдөг. Цаг их авдаг учраас бүртгэгдсэн document-уудай харьцуулалт хийдэггүй. Мэдээж хэрэг тухайн хэрэглэгч нь итгэж болохуйц хүн байна. Иймээс энэхүү үйлдэл нь давуу эрхтэй. Бусад бүх document-ууд нь доор бичсэнчлэн энгийн document бүртгэлийн системээр бүртгэгдэнэ.
  2. Document баталгаажуулалт : хэрэглэгч document-ийг хууль бусаар ашиглах зорилготой document харьцуулагч системийг идэвхжүүлж document-ийг салгаж болно. Хариуд нь document харьцуулагч хэсэг document зохицуулагч хэсгийг ажиллуулж бүтцийн шинжийг тодорхойлно. Бүхий л сэжигтэй document-ууд хэрэглэгчид буцаад мэдэгдэнэ.
  3. Энгийн document бүртгэгч : энэхүү үйлдэл нь ерөнхийдөө document баталгаажуулагч системийг ажиллуулж оруулсан document хууль бусаар хуулбарласан эсэхийг шалгана. Хэрэв сэжигтэй document илрээгүй бол database-д бүртгэгдэнэ. Хэрэв сэжигтэй гэж үзвэл хэрэглэгчид нэмэгдэнэ.

Document зохицуулалт - Document зохицуулалтын хэсэг нь нэгдүгээр зурагт үзүүлсэнчлэн угсраа байрлах 3 үеэс бүрдэнэ. Document таних, тусгай үг хэллэг зөөвөрлөх, бүтцийн хэв байдлыг байгуулах дэд бүтэцтэй.

Document таних –Document таних хэсэг нь батлагдсан document-ийг энгийн ASCII document болгож өөрчилдөг. CHECK-ийн одоогийн хувилбар нь зөвхөн s laTEX document-уудыг таньдаг. Бусад document-ууд DVI гэх мэт document-ууд таньдаг бөгөөд ASCII-руу шилжүүлсэн document-ууд бас ажиглагддаг. s latex-ийг ASCII текстрүү шилжүүлэхэд бүтцийг нь эрэмбэлж, зөв дараалалд оруулж түлхүүр үгнүүдийг авна. Иймээс бид ердөө unix-ийг ашиглаж болохгүй. Document-ийн бүтцээр нь эрэмбэлснээр харьцуулалт хийхэд хялбар болно. Энэ нь зарим хэрэгцээгүй харьцуулалтуудыг устгана. Түлхүүр үгс нь жишээлбэл document-д тодоор бичсэн, утга нь document уялдаатай үгнүүд түлхүүр үгсийг ашиглан харьцуулалт хийхэд тусалдаг. S laTEX танигч нь document болгоныг нэг удаа шалгадаг. Энэхүү шалгалт дотор мод шиг бүтэц үүсгэгдэж document-ийн бүтцийг задалдаг. Бүхий л document дотор олон талаас харж дүгнэж, хэсэг хэсгээр нь , гарчгаар нь , хуудсын эрэмбээр тогтоож болдог. 2а болон 2б зурагнууд s latex document-ийг болон document-ийн модны жишээ байгаа. Энэнд document-ийн модны үндэс нь document-ийг дүрсэлж бусад зүйлс нь , жишээлбэл гарчиг нь харилцан уялдаатай байгаа. Бүх хэсэг нь олон жижиг хэсгүүдээс бүрдсэн байдаг ба тэдгээр нь бүр жижиг хэсгүүдээс бүрднэ. Навч нь л гэхэд document дотор байгаа нэг зүйлийн талаар өгүүлэх ба эднийг document хэсэгчлэхэд ашиглаж болно.

Мөрөөр хайх алгоритм

Компьютерын шинжлэх ухаанд, мөрөөр хайх алгоритм, заримдаа мөр тохируулах алгоритм гэж нэрлэдэг алгоритм нь нэг болон хэд хэдэн мөрийг том текстээс хайж олох мөр алгоритмын чухал анги юм.

Энгийн боловч үр ашиггүй арга замыг харья нэг мөр нь нөгөөхийн дотор хаана нь тохирч байгааг мэдэхийн тулд тус бүрээр нь шалгана. Тэгэхээр нэг 9бүхэл8эхийн эхний үг нь хуулбар байна уу гэдгийг бид эхлээд харна, хэрэв үгүй бол бид энэ эхийн хоёр дахь үгийг нь мөн хуулбар эсэхийг харна, хэрэв тийм биш бол бид гурав дахь, дөрөв дэх үгийг хархаар эхлэх гэх мэт. Хэвийн тохиолдолд бид тэр эхийн нэг дэх хоёр дахь үгийг нь хараад энэ үг нь буруу байрлалтай гэдгийг нь мэднэ, дундаж тохиолдолд O(n+m) –ийм үйлдэл гаргадаг, n-нь эхийн урт m-нь үгийн урт, гэхдээ хамгийн муу тохиолдолд "aaaaaaaaab" шиг үгээс "aaaab" шиг үгийг хайхад, энэ нь O (nm) авдаг.

Эшлэл

[1] [2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

  1. Abdelmoneim, Salah-Eldin (September 30, 2010). "Plagiarism What is it? How to avoid it?" (PDF). 14th Alexandria Anaesthesia & Intensive Care Conference. Alexandria Faculty of Medicine.
  2. Koovakkai, Dineshan (March 2–4, 2011). "Diagnosing Plague: Tools And Techniques For Detecting Plagiarism" (PDF). 8th International CALIBER - 2011, Goa University, Goa. INFLIBNET Centre, Ahmedaba, India.
  3. Mapes, Diane (September 10, 2009). "Steal this story? Beware Net's plagiarism 'cops'". MSNBC.com.
  4. King, Irwin (April 1, 2010). "Introduction to Social Computing". Database Systems for Advanced Applications: 15th International Conference, 2010, Tsukuba, Japan, Proceedings, Part II. p. 482. {{cite book}}: Unknown parameter |editors= ignored (|editor= suggested) (help)
  5. Vij, Rajeev; Soni, Navin Kumar; Makhdumi, Gayas (February 25–27, 2009). "Encouraging Academic Honesty through Anti-plagiarism Software" (PDF). 7th International CALIBER-2009, Pondicherry University, Pondicherry. INFLIBNET Centre, Ahmedabad, India: 444. Эх хувилбараас (PDF) архивласан: 2012-03-24.
  6. Stein, Benno; Koppel, Moshe; Stamatatos, Efstathios (Dec 2007), "Plagiarism Analysis, Authorship Identification, and Near-Duplicate Detection PAN'07" (PDF), SIGIR Forum, 41 (2), doi:10.1145/1328964.1328976
  7. Potthast, Martin; Stein, Benno; Eiselt, Andreas; Barrón-Cedeño, Alberto; Rosso, Paolo (2009), "Overview of the 1st International Competition on Plagiarism Detection", PAN09 - 3rd Workshop on Uncovering Plagiarism, Authorship and Social Software Misuse and 1st International Competition on Plagiarism Detection (PDF), CEUR Workshop Proceedings, vol. 502, pp. 1–9, ISSN 1613-0073
  8. Stein, Benno; Meyer zu Eissen, Sven; Potthast, Martin (2007), "Strategies for Retrieving Plagiarized Documents", Proceedings 30th Annual International ACM SIGIR Conference (PDF), ACM, pp. 825–826, doi:10.1145/1277741.1277928, ISBN 978-1-59593-597-7
  9. Meyer zu Eissen, Sven; Stein, Benno (2006), "Intrinsic Plagiarism Detection", Advances in Information Retrieval 28th European Conference on IR Research, ECIR 2006, London, UK, April 10–12, 2006 Proceedings (PDF), Lecture Notes in Computer Science, vol. 3936, Springer, pp. 565–569, doi:10.1007/11735106_66
  10. Bao, Jun-Peng; Malcolm, James A. (2006), "Text similarity in academic conference papers", 2nd International Plagiarism Conference Proceedings (PDF), Northumbria University Press
  11. Clough, Paul (2000), Plagiarism in natural and programming languages an overview of current tools and technologies (PDF) (Technical Report), Department of Computer Science, University of Sheffield
  12. Culwin, Fintan; Lancaster, Thomas (2001), "Plagiarism issues for higher education" (PDF), Vine, 31 (2): 36–41, doi:10.1108/03055720010804005
  13. Lancaster, Thomas (2003), Effective and Efficient Plagiarism Detection (PDF) (PhD Thesis), School of Computing, Information Systems and Mathematics South Bank University
  14. Maurer, Hermann; Zaka, Bilal (2007), "Plagiarism - A Problem And How To Fight It", Proceedings of World Conference on Educational Multimedia, Hypermedia and Telecommunications 2007, AACE, pp. 4451–4458
  15. Hoad, Timothy; Zobel, Justin (2003), "Methods for Identifying Versioned and Plagiarised Documents" (PDF), Journal of the American Society for Information Science and Technology, 54 (3): 203–215, CiteSeerX 10.1.1.18.2680, doi:10.1002/asi.10170
  16. Stein, Benno (July 2005), "Fuzzy-Fingerprints for Text-Based Information Retrieval", Proceedings of the I-KNOW ‘05, 5th International Conference on Knowledge Management, Graz, Austria (PDF), Springer, Know-Center, pp. 572–579
  17. Brin, Sergey; Davis, James; Garcia-Molina, Hector (1995), "Copy Detection Mechanisms for Digital Documents", Proceedings of the 1995 ACM SIGMOD International Conference on Management of Data (PDF), ACM, pp. 398–409, doi:10.1145/223784.223855, ISBN 1-59593-060-4
  18. Gipp, Bela (2014), "Citation-based Plagiarism Detection - Detecting Disguised and Cross-language Plagiarism using Citation Pattern Analysis", Springer Vieweg Research, ISBN 978-3-658-06393-1 http://www.springer.com/springer+vieweg/it+%26+informatik/k%C3%BCnstliche+intelligenz/book/978-3-658-06393-1 {{citation}}: Missing or empty |title= (help)
  19. Monostori, Krisztián; Zaslavsky, Arkady; Schmidt, Heinz (2000), "Document Overlap Detection System for Distributed Digital Libraries", Proceedings of the fifth ACM conference on Digital libraries (PDF), ACM, pp. 226–227, doi:10.1145/336597.336667, ISBN 1-58113-231-X
  20. Baker, Brenda S. (February 1993), On Finding Duplication in Strings and Software (gs) (Technical Report), AT&T Bell Laboratories, NJ
  21. Khmelev, Dmitry V.; Teahan, William J. (2003), "A Repetition Based Measure for Verification of Text Collections and for Text Categorization", SIGIR'03: Proceedings of the 26th annual international ACM SIGIR conference on Research and development in information retrieval, ACM, pp. 104–110, CiteSeerX 10.1.1.9.6155, doi:10.1145/860435.860456
  22. Si, Antonio; Leong, Hong Va; Lau, Rynson W. H. (1997), "CHECK: A Document Plagiarism Detection System", SAC ’97: Proceedings of the 1997 ACM symposium on Applied computing (PDF), ACM, pp. 70–77, doi:10.1145/331697.335176, ISBN 0-89791-850-9
  23. Dreher, Heinz (2007), "Automatic Conceptual Analysis for Plagiarism Detection" (PDF), Information and Beyond: The Journal of Issues in Informing Science and Information Technology, 4: 601–614
  24. Muhr, Markus; Zechner, Mario; Kern, Roman; Granitzer, Michael (2009), "External and Intrinsic Plagiarism Detection Using Vector Space Models", PAN09 - 3rd Workshop on Uncovering Plagiarism, Authorship and Social Software Misuse and 1st International Competition on Plagiarism Detection (PDF), CEUR Workshop Proceedings, vol. 502, pp. 47–55, ISSN 1613-0073
  25. Gipp, Bela; Beel, Jöran (July 2009), "Citation Proximity Analysis (CPA) - A new approach for identifying related work based on Co-Citation Analysis", Proceedings of the 12th International Conference on Scientometrics and Informetrics (ISSI’09) (PDF), International Society for Scientometrics and Informetrics, pp. 571–575, ISSN 2175-1935
  26. Gipp, Bela; Beel, Jöran (June 2010), "Citation Based Plagiarism Detection - A New Approach to Identifying Plagiarized Work Language Independently", Proceedings of the 21st ACM Conference on Hypertext and Hypermedia (HT'10) (PDF), ACM, pp. 273–274, doi:10.1145/1810617.1810671, ISBN 978-1-4503-0041-4
  27. Gipp, Bela; Meuschke, Norman; Beel, Jöran (June 2011), "Comparative Evaluation of Text- and Citation-based Plagiarism Detection Approaches using GuttenPlag", Proceedings of 11th ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL’11) (PDF), ACM, pp. 255–258, doi:10.1145/1998076.1998124, ISBN 978-1-4503-0744-4
  28. Gipp, Bela; Meuschke, Norman (September 2011), "Citation Pattern Matching Algorithms for Citation-based Plagiarism Detection: Greedy Citation Tiling, Citation Chunking and Longest Common Citation Sequence", Proceedings of the 11th ACM Symposium on Document Engineering (DocEng2011) (PDF), ACM, pp. 249–258, doi:10.1145/2034691.2034741, ISBN 978-1-4503-0863-2
  29. Holmes, David I. (1998), "The Evolution of Stylometry in Humanities Scholarship", Literary and Linguistic Computing, 13 (3): 111–117, doi:10.1093/llc/13.3.111
  30. Juola, Patrick (2006), "Authorship Attribution" (PDF), Foundations and Trends Information Retrieval, 1: 233–334, doi:10.1561/1500000005, ISSN 1554-0669
  31. Meuschke, Norman (May 31, 2012). "CitePlag: A Citation-based Plagiarism Detection System Prototype (conference paper)" in 5th Annual Plagiarism Conference.. 
  32. Portal Plagiat - Softwaretest 2004 (German хэлээр), HTW University of Applied Sciences Berlin, Татаж авсан: October 6, 2011{{citation}}: CS1 maint: unrecognized language (link)
  33. Portal Plagiat - Softwaretest 2008 (German хэлээр), HTW University of Applied Sciences Berlin, Татаж авсан: October 6, 2011{{citation}}: CS1 maint: unrecognized language (link)
  34. Portal Plagiat - Softwaretest 2010 (German хэлээр), HTW University of Applied Sciences Berlin, Татаж авсан: October 6, 2011{{citation}}: CS1 maint: unrecognized language (link)
  35. Potthast, Martin; Barrón-Cedeño, Alberto; Eiselt, Andreas; Stein, Benno; Rosso, Paolo (2010), "Overview of the 2nd International Competition on Plagiarism Detection", Notebook Papers of CLEF 2010 LABs and Workshops, 22–23 September, Padua, Italy (PDF)
  36. Potthast, Martin; Eiselt, Andreas; Barrón-Cedeño, Alberto; Stein, Benno; Rosso, Paolo (2011), "Overview of the 3rd International Competition on Plagiarism Detection", Notebook Papers of CLEF 2011 LABs and Workshops, 19–22 September, Amsterdam, Netherlands (PDF)
  37. Stein, Benno; Lipka, Nedim; Prettenhofer, Peter (2011), "Intrinsic Plagiarism Analysis" (PDF), Language Resources and Evaluation, 45 (1): 63–82, doi:10.1007/s10579-010-9115-y, ISSN 1574-020X
  38. Potthast, Martin; Barrón-Cedeño, Alberto; Stein, Benno; Rosso, Paolo (2011), "Cross-Language Plagiarism Detection" (PDF), Language Resources and Evaluation, 45 (1): 45–62, doi:10.1007/s10579-009-9114-z, ISSN 1574-020X
  39. Weber-Wulff, Debora (June 2008), "On the Utility of Plagiarism Detection Software", In Proceedings of the 3rd International Plagiarism Conference, Newcastle Upon Tyne (PDF)