מחשביםטכנולוגיית המידע

קידוד של מידע בטקסט במחשב

מחשב - מכשיר מתוחכם שבה אתה יכול ליצור, להמיר, ו לאחסן מידע. עם זאת, המחשב לא עובד בצורה מאוד מובנת לנו - גרפי, טקסט ונתונים מספריים מאוחסן מערכים בינארי מספרים. במאמר זה נבחן כיצד את הקידוד של מידע בטקסט.

מה בשבילנו הוא הטקסט של מחשב - רצף של תווים. כל סמל מייצג קבוצה מסוימת של אפסים ואחדים. תחת הסמלים נועדו לא רק אותיות גדולות וקטנות אותיות הלטיניות האלפבית, אלא גם סימני פיסוק, סימנים אריתמטיים, תווים מיוחדים, סימנים מיוחדים ואפילו בחלל.

קידוד בינארי של מידע טקסטואלי

על ידי לחיצה על מקש מסוים על המבקר הפנימי שולח אות חשמלית כי מומר קוד בינארי. קוד משתווה עם סמל מסוים, אשר מוצג על המסך. להגשה באלפבית הלטיני בתוך ASCII בפורמט דיגיטלי קידוד מערכת בינלאומית נוצר. זה דורש 1 בייט עבור הקלטת סמל אחד ובכך מורכב רצף שמונה-סמל של אפסים ואחדים. מרווח ההקלטה - מ 00000000 11111111 אל, כלומר קידוד של מידע טקסט באמצעות מערכת זו מאפשר לנו לייצג 256 תווים. ברוב המקרים, זה מספיק.

ASCII מחולק לשני חלקים. 127 התווים הראשונים (מתוך 00,000,000 כדי 01,111,111) הם בינלאומיים הם סימנים ספציפיים אותיות האלפבית האנגלי. החלק השני - את הסיומת (מ 10,000,000 עד 11,111,111) - נועד לייצג את האלפבית הלאומי, כתיבת השונה מן הלטינית.

מידע קידוד טקסט ASCII בנוי על העיקרון של רצף הגדלה, כלומר, המספר הגדול יותר הרצף של אותיות, כך גדל הערך של ASCII-הקוד שלה. דמויות וחלק רוסי השולחן בנויים על אותו העיקרון.

עם זאת, בעולם ישנם מספר סוגים של קידוד עבור באותיות קיריליות. הסוג הנפוץ ביותר - הוא קוי-8 (שמונה סיביות קידוד כי שימש במשך בשנות ה -70 במערכת ההפעלה יוניקס הראשונה ruifitsirovannyh), ISO 8859-5 (שפותחה על ידי הלשכה התקינה הבינלאומי), מחסום 1251 (מידע טקסטואלי קידוד בשימוש המודרנית מערכת ההפעלה Windows), כמו גם קידוד 2-בייט של Unicode, אשר ניתן להשתמש בהם כדי להציג 65,536 תווים. כזה מגוון של קידודים בשל העובדה כי הם פותחו בזמנים שונים, עבור מערכות הפעלה שונות ושיקולים שונים. יש מסיבה זו, לעיתים קרובות בקשיים בעת העברת הטקסט ממדיום אחד למשנהו - מתוך חוסר התאמה קידוד המשתמש יראה קבוצה של סמלים מבלבל. איך אני יכול לתקן את המצב הזה? ב- Word, למשל, כאשר נפתח מסמך, הודעה על בעיות עם תצוגת טקסט מציעה מספר אפשרויות המרה.

לפיכך, קידוד ועיבוד של מידע טקסטואלי של מעי המחשב - התהליך קשה ונדרש זמן רב מאורגן. כל הסמלים של כל האלפבית הם רק רצף מסוים של ספרות של מערכת בינארית, תא אחד - זה בייט אחד של מידע.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 iw.birmiss.com. Theme powered by WordPress.