Өгөгдөл

Чөлөөт нэвтэрхий толь — Википедиагаас
Харайх: Удирдах, Хайлт

Өгөгдөл бол нарийвчилсан үйлдэлтэй тайлбараар утга нь өгөгдсөн нэг ба олон тэмдэгтийн дараалал юм.

Өгөгдөл (datum – өгөгдлийн нэг нэгж) бол мэдээлэл биш. Өгөгдөл мэдээлэл болохын тулд тайлбар шаарддаг. Өгөгдлийг мэдээлэлд хөрвүүлэхэд хэд хэдэн мэдэгдэж буй хүчин зүйл тодорхойлогдох ёстой. Оруулсан хүчин зүйлүүд нь өгөгдлийн үүсгэгч ба хүссэн мэдээллээр тодорхойлогдоно. Метадата нөхцөл нь өгөгдлийн талаарх өгөгдлийг лавлаж өгөхөд хэрэглэгддэг. Метадата нь давхар утгатай, нарийвчлагдсан, өгөгдсөн байж болно. Физик үзэгдэл, үйл явцтай холбоотой өгөгдөл нь түр зуурын бүрэлдэхүүнтэй байна. Энэхүү түр зуурын бүрэлдэхүүний бараг бүх жишээ давхар утгатай байдаг. Удаах бол температур бүртгэгч гэх мэт хэрэгсэл температур мэдрэгчээс өгөгдөл хүлээн авсан үеийн жишээ юм. Температур хүлээн авсан үед өгөгдөл “одоо”-гийн түр зуурын тайлбартай байна гэж авч үздэг. Иймээс тухайн хэрэгсэл огноо, цагийг хамтад нь бичиж авдаг. Өгөгдөл бүртгэгч температурыг мэдээллэсэн үедээ мөн температур бүр дэх огноо, цагийг хамтад нь илтгэх ёстой.

Тоон өгөгдөл буюу дижитал өгөгдөл гэдэг нь 1 ба 0 цифрээс бүтдэг хоёртын систем ашиглан үзүүлэгддэг өгөгдөл юм. Энэ нь аналог үзүүлэнгийн эсрэг нь юм. Орчин үеийн (1960-аас хойш) компьютерийн системд бүх өгөгдөл тоон систем дээр байгаа. Компьютер доторх өгөгдөл ихэнх кейс дээр зэрэгцээ өгөгдөл маягаар хөдөлдөг. Компьютероос гарсан, орсон өгөгдөл дараалласан өгөгдөл маягаар хөдөлдөг. Температур мэдрэгч гэх мэт аналог хэрэгслээс үүсэлтэй өгөгдөл аналог өгөгдлийг тоон өгөгдөлд хувиргахын тулд “analog to digital converter(ADC)”-аар дайрж өнгөрөх ёстой.

Компьютероор гүйцтгэгдсэн үйл ажиллагаан дээр тоо хэмжээ, тэмдэгтүүдийг үзүүлдэг өгөгдөл нь соронзон, гэрлийн(оптик), механик мэдээ хадгалагчид хадгалагдаж, бичигддэг ба тоон цахилгаан дохионы хэлбэрт шилждэг.

Програм гэж компьютер болон бусад машины үйл ажиллагааг удирдахын тулд кодлосон програм хангамжийн зааварчилгааны дарааллуудаас тогтсон өгөгдлийн багц. Физик компьютерийн санах ойн элементүүд хаяг ба өгөгдөл хадгалалтын байт/үг-ээс тогтдог. Тоон өгөгдөл нь ихэвчлэн хүснэгт, SQL өгөгдлийн сан гэх мэт харилцан хамааралтай өгөгдлийн сангуудад хадгалагддаг ба ерөнхийдөө хийсвэр түлхүүр/утгын хослол маягаар үзүүлэгдэж болно.

Өгөгдөл нь өгөгдлийн өгөгдлийн цуваа, график, объект гэх мэт өгөгдлийн байгууламжийн олон ялгаатай төрөлд зохион байгуулагдаж болно. Өгөгдөл нь гадаад тоног төхөөрөмжийн тусламжтайгаар компьютероос орж, гарч болно.

Өөр нэгэн янзын хэрэглээнд хоёртын системийн файлыг хүн уншиж болох текстээс ялгах зорилгоор өгөгдөл гэж нэрлэгддэг. 2007 оны байдлаар тоон өгөгдлийн нийт хэмжээг 281 тэрбум гигабайт гэж тооцсон байдаг.

Шинж чанар

Үүний хамгийн гол зүйл нь нэг датум нь тодорхой байршилд хадгалагдах утга юм.

Үндсэндээ, компьютерууд өгөгдөл хэлбэрээр өгөгдсөн зааварчилгаануудын дарааллыг дагадаг. Өгөгдсөн ажлыг гүйцэтгэх зааварчилгааны багцыг програм гэдэг. Нэр дурдсан жишээн дээр програм нь компьютероор гүйцэтгэгддэгийнхээ хувьд хоёртын машины кодоос тогтно. Програмаар гардан удирдагддаг ч яг ч CPU-р гүйцэтгэгддэггүй багтаамжийн элементүүд ч мөн өгөгдөл юм. Програмын зааварчилгаа болох The Marvellous twist ба програмын удирддаг өгөгдөл хоёр нь хоёулаа яг ижил замаар хадгалагддаг. Цаашлаад компьютерийн програмууд өөр компьютерийн програмууд дээр тэдний програмын өгөгдлийг удирдах замаар ажиллах боломжтой.

Програм ба өгөгдлийн хоорон дахь шугам тодорхой биш байж болно. Жишээ нь interpreter (орчуулагч) нь нэгэн програм билээ. Орчуулагч руу орох оролтын өгөгдөл нь угаас машины хэл дээр илэрхийлэгдсэн ердийн нэгэн зүйл биш, энэ нь өөрөө програм юм. Ихэнх тохиолдолд орчуулагдсан програм нь текст хянагч програмаар (эгэл текстэн өгөгдөлтэй илүү энгийнээр зохицдог) удирдагдсан хүн уншиж болох текстийн файл болно. Метапрограмминг мөн адилаар бусад програмыг өгөгдөл маягаар удирддаг програмыг татан оролцуулдаг. Түүвэрлэгч, холбогч, дебаггер, програм сайжруулагч, вирус хайгч гэх мэм програмууд бусад програмыг өгөгдөлөө болгож ашигладаг.

Файлд өгөгдлийн байт хадгалахын тулд файлын форматад тохируулагдсан байх ёстой. Ерөнхийдөө програмууд бусад өгөгдөлд хэрэглэдгээс ялгаатай тусгай файлын төрөлд хадгалагддаг. Гүйцэтгэгдэхүйц файлууд програм агуулдаг, бусад бүх файлууд ч бас өгөгдлийн файл байдаг. Хэдий тийм ч гүйцэтгэгдэхүйц файлууд програмд “built-in”-ддэг “in-line” өгөгдөл агуулдаг. Нарийвчилбал зарим гүйцэтгэгдэхүйц файлууд тогтмол ба анхдагч утгуудыг (хоёулаа өгөгдөл) нэр төдий агуулдаг өгөгдлийн сегмент гэгчийг агуулдаг.

Жишээлбэл: нэгэн хэрэглэгч нэг файлаас үг боловсруулах програм ачааллахын тулд үйлдлийн системийг анх зааварчилсан байг, тэгээд үг боловсруулах програмтай өөр нэгэн файлд хадгалагдсан баримт бичиг (документ) янзлах байг. Энэ жишээн дээр баримт бичиг нь өгөгдөл гэж тооцогдох байв. Үг боловсруулагч хэрэв зөв бичгийн алдаа шалгадаг бол үүний үгийн жагсаалт нь өгөгдөл нь болно. Зөв бичгийн алдаа шалгах алгоритм нь нэг бол машины кодон өгөгдөл болно, эсвэл тайлбарлаж болох ямар нэг програмчлалын хэлний текст болно.

Өгөгдлийн түлхүүр ба утгууд, байгууламж ба тогтмол

Өгөгдөл дэх түлхүүрүүд утгуудыг контекстоор хангаж байдаг. Өгөгдлийн байгууламжаас үл хамааран түлхүүрийн олонлог үзэгдэж байдаг. Өгөгдөл дэх өгөгдлийн түлхүүр ба өгөгдлийн байгууламж нь өгөгдлийн утгад өгч байгаа утгын үндсэн суурь юм. Аливаа утга ба байгууламж дахь утгын цуглуулгатай шууд болон шууд бусаар холбогдсон түлхүүргүйгээр утгууд нь утгагүй болдог бөгөөд өгөгдөл байхаа больдог. Өөрөөр хэлбэл, өгөгдөл гэж тооцогдохын тулд утгын олонлогт холбогдсон дор хаяж нэг түлхүүрийн олонлог байхаас өөр аргагүй юм. Өгөгдөл нь компьютерт хэд хэдэн янзаар үзүүлэгдэж чаддаг, жишээ нь:

RAM (Random Access Memory-Шуурхай Санах Ой)

• Шуурхай санах ой нь компьютерийн процессорын (CPU) шууд хандсан өгөгдлүүдийг хадгалж байдаг. CPU санах ойд эсвэл өөр дээрээ өгөгдлийг ашиглаж болно.Энэ нь процессор өгөгдлийг хадгалалтын хэрэгсэл ба санах ойн хооронд зөөвөрлөх ёстой өгөгдлийн байнгын хадгалалтын эсрэг нь юм. RAM нь процессор унших ба бичих үйл ажиллагаанд хаяг өгөх замаар уншиж бичиж болдог шугаман зэргэлдээ байрлалуудын 1 ба хэд хэдэн блокын өгөгдлийн цуваа юм. RAM гэдгийн “random” буюу дурын гэдэг нь процессор ямар ч дарааллаар, ямар ч үед, санах ойн аль ч байршилд үйл ажиллагаагаа явуулж болно гэсэн үг. (Memory management unit-г хар). RAM-д өгөгдлий хамгийн бага элемент нь “Хоёртын бит” юм. RAM-д хандах хүчин чадал ба хязгаар нь процессорын тусгай мэдээлэл юм. Үндсэн санах ой буюу RAM нь “цахилгаан унтраалгын свич”-ийн өгөгдлийн цуваа эсвэл арванзургаатын тооллын системийн 0-ийн хаяг дээр эхлэлтэй байрлалаар эрэмбэлэгдсэн байдаг. Байрлал бүр процессорын байгууламжаас хамаарч ихэвчлэн 8, 16, 32, 64 параллель битээр хадгалагддаг. Цаашлаад RAM дахь нэг байтад хадгалагдсан ямар ч утга n нь санах ойн байршлын өгөгдлийн цуваа руу салаалсан 0+n байх санах ойн өгөгдлийн цуваан дахь санах ойн хамгийн эхний байршлаас гарсан салаа буюу тохирсон байршилтай байдаг.

Түлхүүр

• Өгөгдлийн түлхүүр санах ойд техник хангамжийн шууд хаяг биш байх хэрэгтэй. Шууд бус, хийсвэр, логик түлхүүр кодууд өгөгдлийн байгууламж байгуулах утгатайгаар хадгалагдаж болно. Өгөгдлийн байгууламжууд өгөгдлийн утгууд хадгалагдсан хэсэгт байгууламжийн эхнээс л урьдчилан төлөвлөсөн салаануудтай байна. Цаашлаад өгөгдлийн түлхүүр байгууламж руу орох салаан дээр нэмэгдэх түлхүүрүүдээс тогтоно. Ийм байгууламжууд давтагдсан үед өгөгдлийн утгууд болон түлхүүрүүдийг давтагдаж буй ижил байгууламжуудад хадгалахад үр дүнд нь давтагдаж буй байгууламжууд багана, байгууламж тус бүрийн давталт нь мөр болсон хүснэгт үүсгэж болдог. Өгөгдлийн иймэрхүү зохион байгуулалтад өгөгдлийн түлхүүр нь ихэвчлэн багануудын нэгэнд байдаг. Зохион байгуулалттай өгөгдлийн давталттай байгууламж

• Давталттай өгөгдлийн байгууламжийн хүснэгтэн байдал бол олон боломжит аргуудын дундах зөвхөн нэг л арга зам юм. Давталттай өгөгдлийн байгууламжийг зангилаа нь эхтэй, салаатай шаталсан маягтайгаар зохион байгуулж болно. Утгууд болон цогц өгөгдлүүд нь зангилаанд холбогдсон байна. Ийм маягаар зангилаатай шаталсан хэлбэр нь өгөгдлийн хаяглалтын түлхүүр болж зангилаан холбож өгдөг. Энэ үзүүлэн модны үндсийг санагдуулж болох юм. Жишээлбэл, орчин үеийн компьютерийн үйлдлийн систем нь нийтлэг нэгэн жишээ юм. Эрэмбэлэгдсэн өгөгдөл

• Өгөгдөл түлхүүрээрээ эрэмбэлэгдэх үедээ салшгүй онцлогуудтай болдог. Түлхүүрийн дэд олонлог дахь бүх утгууд хамт харагддаг. Ижил түлхүүрээр өгөгдлийн бүлгүүд рүү дарааллан нэвтрэх үед эсвэл түлхүүрийн дэд олонлог өөрчлөгдөх үед энэ нь гэмтэл, эсвэл удирдлагын гэмтэл гэж тооцогддог. Ялангуяа энэ нь түлхүүрийн дэд олонлог дээр өгөгдөл хуримтлагдахаас хөнгөвчилж өгдөг. Гадаад тоног төхөөрөмжийн санах ой

• USB холболт гэх мэт компьютероос гадна санах ой гарч ирэх хүртэл тогтмол өгөгдлийн санах ойг соронзон хальс, диск драйв гэх мэт гадаад блок дээр өгөгдөл бичих уламжлалт арга ашиглаж авдаг байсан. Ийм хэрэгслүүд ерөнхийдөө соронзон хальсны мэдээллийн байрлал руу гүйлгээд, тэгээд урьдчилан төлөвлөсөн хэмжээний хэсэг өгөгдлийг уншиж, бичдэг байсан. Энэ нөхцөлд мэдээллийн гүйлгэлт нь өгөгдлийн түлхүүр болж, блокууд нь өгөгдлийн утга байв. Эхэн үеийн өгөгдлийн файлын систем буюу дискний үйлдлийн систем нь өгөгдлийн файлд зориулсан диск драйв дээрх зэргэлдээ блокуудыг нөөцөлдөг байв. Ийм системүүдэд бүх өгөгдөл бичигдэхээсээ өмнө санах ойг дүүргэчихэж ч болдог байв. Иймээс ихээхэн өгөгдлийн зай нөхцөл байдлыг муутгахаас сэргийлж хэрэглэгдэхгүйгээр нөөцлөгддөг байв. Үүнийг боловсруулаагүй диск ч гэдэг байв. Сүүлийн үеийн файлын системүүд хэсэглэх аргыг танилцуулсан. Тэд дискний өгөгдлийн зайг хэсэг хэсгээр нөөцөлж, төсөвлөсөн хэсэг хэсэг блокийг хэрэгцээнийх нь хэрээр хөдөлгөөнтэйгөөр хандах замаар блокуудыг илүү хэмнэлттэйгээр ашигласан. Үүнд хүрэхийн тулд файлийн системүүд файлын төсвийн хүснэгт эсвэл өгөгдлийн файлын блокууд дээр анхаарлаа хандуулахаас өөр аргагүй болсон. Хэдийгээр энэ нь дискний өгөгдлийн зайны илүү дээр ашиглалтыг бий болгосон ч , үр дүнд нь дискэн дээр файл хэсэгчлэгдэх, хугацаанаас үүдэлтэй дагалдах үйлдлийн нэмэлт зардал үүссэн. Орчин үеийн файлын систем файлын хандах хугацааг бататгахын тулд хэсэгчлэгдсэн файлыг дахин зохион байгуулдаг. Файлын системийн үсрэнгүй хөгжил нь логик драйв хэд хэдэн физик драйваас хэсэг хэсгээрээ тодорхойлогдож болдог, диск драйвын виртуалжуулалтад хөтөлсөн.

Индексжүүлсэн өгөгдөл

• Томоохон олонлогоос өгөгдлийн жижиг дэд олонлогийг гаргаж сэргээх нь өгөгдлийг дараалалтайгаар хайх давхар утгатай. Энэ нь хэмнэлттэй зүйл биш юм. Индекс нь файл, хүснэгт, өгөгдлийн олонлогт өгөгдлийн байгууламжаас түлхүүр ба байршлын хаягийг хуулах, тэгээд дараа нь эх өгөгдлийн дэд олонлогийг сэргээж авах цагийг багасгахын тулд модны үндсэн байгууламжийг ашиглаж зохион байгуулдаг. Үүнийг хийхийн тулд сэргээн гарган авах явц эхлэхээс өмнө сэргээх өгөгдлийн дэд олонлогийн түлхүүр мэдэгдэжбайх ёстой. Хамгийн түгээмэл индексүүд бол В-мод ба чагт тэмдгийн аргууд билээ. Индексжүүлэх нь мөн сэргээн гарган авах болон файлд гарах нэмэлт төлбөр ихтэй байдаг өөр нэг жишээ юм. Индекс зохион байгуулах өөр өөр аргууд байдаг, жишээлбэл түлхүүр эсвэл тоо хэмжээний зөв эсэхийг шалгах шалгалтыг эрэмбэлэх (түлхүүр ба өгөгдлийг хамтад нь ч) ба тэдэн дээр хоёртын хайлт хийх. Хийсвэрлэлт ба шууд бус байдал

• Объектийн чиг баримжаа нь өгөгдөл ба программыг ойлгох 2 суурь үзэл баримтлалыг ашигладаг: 1) Шаталсан өгөгдлийн байгууламжийн жишээ болох program-code classes-ийн таксономийн эрэмбэтэй байгууламж 2) Ачааллах үедээ өгөгдлийн түлхүүрийн үүсэл class library-с жишээгээр үзүүлэгдсэн объектуудын санах ойн өгөгдлийн байгууламжид хандаж лавладаг. Нарийвчилсан ангийн объект, гүйцэтгэгдэж байгаа жишээ үзүүлэлтийн дараа л оршин байдаг. Объектийн түлхүүрийн лавлагаа хоослогдсны дараа тэр объектоор лавлагдсан өгөгдөл өгөгдөл байхаа больдог ба цаашлаад объект ч бас оршин байхаа больдог. Объектийн өгөгдөл хадгалагдсан санах ойн байршил тэгээд хэрэггүй болж дахин ашиглахад, хоосон зай болж ангилагддаг. Өгөгдлийн сангийн өгөгдөл

• Өгөгдлийн сангийн бий болсон нь тогтмол өгөгдөл хадгалалтад зориулж илүү зайтай хийсвэр давхрагыг танилцууллаа. Өгөгдлийн сангууд тогтмол өгөгдлийн үед метадата, хэрэглэгч ба серверийн системийн хооронд байгууламжтай лавлах хэлийн протокол ашиглаж, сүлжээгээр холбон, шилжүүлгийн бүрэн бүтэн байдлыг шалгах 2 үе гаргадаг нэвтрэх систем ашиглаж байна. Зэрэгцээ хуваарилагдсан өгөгдөл боловсруулах

• Орчин үеийн өргөждөг, өндөр хүчин чадлын өгөгдлийн тогтмолын технологи нь өндөр өргөн хүрээний сүлжээн дэх олон тооны бүтээгдэхүүн компьютерууд дээрх зэрэгцээ хуваарилагдсан өгөгдөл боловсруулалтаас үлэмж хэмжээгээр хамааралтай байна. Нэгэн жишээ нь гэвэл Apache Hadoop юм. Ийм системүүдэд өгөгдөл хэд хэдэн компьютеруудад хуваарилагдсан ба систем дэх аль ч компьютер өгөгдлийн түлхүүрт шууд ба шууд бусаар үзүүлэгдсэн байх ёстой. Энэ нь тус бүртээ нэг зэрэг өөр өөр компьютеруудад боловсруулагддаг өгөгдлийн 2 төсөөтэй олонлогийн хоорон дахь ялгаатай байдлыг хүлээн зөвшөөрдөг.