מחשביםתכנות

ASCII (קוד אמריקאי רגיל עבור חילופי מידע) - קידוד טקסט בסיסי עבור האלפבית הלטיני

על פי איגוד הטלקומוניקציה הבינלאומי, בשנת 2016 שלושה וחצי מיליארד אנשים השתמשו באינטרנט עם זה או אחר סדירות. רובם אפילו לא חושב כי כל ההודעות שנשלחו על ידי אותם באמצעות מחשבים או גאדג 'טים ניידים, כמו גם טקסטים המוצגים על כל מיני צגים, הם למעשה שילובים של 0 ו 1. ייצוג כזה של מידע נקרא קידוד. היא מספקת ומאפשרת מאוד את ביצוע האחסון, העיבוד וההעברה שלה. בשנת 1963, הקידוד האמריקאי ASCII פותחה, אשר הנושא של מאמר זה.

הצגת מידע במחשב

מנקודת מבט של כל מחשב אלקטרוני, הטקסט הוא אוסף של סמלים בודדים. למספר שלהם לא רק אותיות, כולל אותיות גדולות, אלא גם סימני פיסוק, מספרים. בנוסף, סמלים מיוחדים "=", "&", "(" וחללים משמשים.

מערכת הסמלים המרכיבים את הטקסט נקראת האלפבית, ומספרם הוא הכוח (מסומן כ- N). כדי לקבוע זאת, השתמש בביטוי N = 2 ^ b, כאשר b הוא מספר הביטים או משקל המידע של סמל מסוים.

הוכח כי אלפבית עם קיבולת של 256 תווים מאפשר לייצג את כל הסמלים הדרושים.

מאז 256 הוא כוח 8 של שני, את המשקל של כל סמל הוא 8 סיביות.

יחידה של 8 סיביות נקראת 1 בתים, לכן נהוג לומר שהקוד הבינארי של כל תו בטקסט המאוחסן במחשב מכיל בית זיכרון אחד.

איך קידוד עובד

כל טקסטים מוזנים בזיכרון של המחשב האישי באמצעות המקשים של המקלדת, שעליהם מספרים כתובים, אותיות, סימני פיסוק וסמלים אחרים. בזיכרון, הם מועברים בקוד בינארי, כלומר, כל תו מקביל לקוד העשרוני המותאם, בין 0 ל 255, אשר מתאים לקוד בינארי - מ 00000000-11111111.

קידוד תווים לפי בתים מאפשר לעבד לבצע עיבוד טקסט כדי לגשת לכל תו בנפרד. יחד עם זאת, 256 תווים מספיקים כדי לייצג כל מידע תו.

קידוד תווים ASCII

קיצור זה באנגלית מייצג קוד אמריקאי סטנדרטי עבור חילופי מידע.

אפילו עם שחר של המחשוב היה ברור כי אתה יכול לבוא עם מגוון רחב של דרכים של קידוד מידע. עם זאת, כדי להעביר מידע ממחשב אחד למשנהו, היה צורך לפתח תקן יחיד. אז, בשנת 1963 בארצות הברית הופיע השולחן של קידוד ASCII. בתוך זה, כל סמל של אלפבית המחשב מוקצה המספר הסידורי שלה ביצוג בינארי. בתחילה, קידוד ASCII שימש רק בארצות הברית, ולאחר מכן הפך את תקן בינלאומי עבור המחשב.

תוכן העניינים

קודי ASCII מחולקים לשני חלקים. התקן הבינלאומי הוא רק המחצית הראשונה של הטבלה. הוא כולל סמלים עם מספרים סידוריים מ -0 (מקודדים כ- 00000000) ל- 127 (קוד 01111111).

מספר הרצף

N

קידוד טקסט ASCII

סמל

0 - 31

0000 0000 - 0001 1111

סמלים עם N בין 0 ל 31 נקראים מנהלים. הפונקציה שלהם היא "להנחות" את התהליך של פלט טקסט לצג או התקן הדפסה, נותן אות שמע, וכו '

32 - 127

0010 0000 - 0111 1111

תווים עם N בין 32 ל 127 (החלק הסטנדרטי של הטבלה) - אותיות גדולות וקטנות של האלפבית הלטיני, 10 ספרות, סימני פיסוק, וכן בסוגריים שונים, סמלים מסחריים ואחרים. סמל 32 מציין רווח.

128 - 255

1000 0000 - 1111 1111

סמלים עם N בין 128 ל 255 (חלק חלופי של הטבלה או דף הקוד) יכול להיות גרסאות שונות, שלכל אחת יש מספר משלה. דף קוד משמש כדי לציין את האלפבית הלאומי, אשר שונה מן הלטינית. בפרט, זה עם העזרה שלה כי ASCII מקודדת תווים רוסיים.

בטבלת הקידוד, אותיות רישיות וקטנות עוקבות זו אחר זו בסדר אלפביתי, והמספרים נמצאים בסדר עולה של ערכים. עיקרון זה נשמר גם לאלפבית הרוסי.

שליטה בתווים

טבלת הקידוד של ASCII נוצרה במקור כדי לקבל ולהעביר מידע על מכשיר שלא נעשה בו שימוש במשך זמן רב, כמו teletype. בהקשר זה, nonprinting נכלל להגדיר את התווים, המשמש פקודות לשליטה במכשיר זה. פקודות דומות שימשו בשיטות העברת הודעות כאלה, כמו קוד מורס, וכן הלאה.

סמל "teletype" הנפוץ ביותר הוא NUL (00, "אפס"). הוא עדיין בשימוש ברוב שפות התכנות, המציין את תו סוף הקו.

כאשר נעשה שימוש בקידוד ASCII

קוד אמריקאי נדרש יש צורך לא רק להקליד מידע טקסט מהמקלדת. הוא משמש גם גרפיקה. בפרט, בתוכנית ASCII Art Maker, תמונות של הרחבות שונות מייצגות טווח של סמלים של תווים ASCII.

מוצרים דומים הם משני סוגים: ביצוע הפונקציה של עורכים גרפיים על ידי המרת תמונות לטקסט המרת "שרטוטים" לתוך גרפיקה ASCII. לדוגמה, סמיילי ידוע הוא דוגמה חיה לסמל קידוד.

ASCII יכול לשמש גם בעת יצירת מסמך HTML. במקרה זה, באפשרותך להזין קבוצה מסוימת של תווים, וכאשר אתה מציג את הדף, מופיע סמל שמתאים לקוד זה.

ASCII נדרש גם כדי ליצור אתרים רב לשוניים, שכן תווים שאינם חלק טבלה לאומית ספציפית מוחלפים עם קודי ASCII.

כמה תכונות

כדי לקודד מידע טקסט בקידוד ASCII, 7 סיביות היו בשימוש הראשון (אחד היה ריק), אבל היום זה עובד כמו אחד 8 סיביות.

האותיות הממוקמות בעמודות בחלק העליון והתחתון שונות זו מזו רק בסיביות בודדות. זה מקטין באופן משמעותי את המורכבות של אימות.

שימוש ב- ASCII ב- Microsoft Office

במידת הצורך, זה סוג של קידוד של מידע טקסטואלי ניתן להשתמש עורכי טקסט של מיקרוסופט, כגון Notepad ו- Office Word. עם זאת, בעת הקלדת, במקרה זה זה יהיה בלתי אפשרי להשתמש בכמה פונקציות. לדוגמה, לא ניתן לבצע הדגשה, מכיוון שהקידוד של ASCII שומר רק על משמעות המידע, תוך התעלמות מהופעתו הכללית ומהצורה הכללית שלו.

תקינה

ISO אימצה תקני ISO 8859. קבוצה זו מגדירה קידודים של שמונה סיביות עבור קבוצות שפה שונות. במיוחד, ISO 8859-1 הוא ASCII מורחב, שהוא טבלה עבור ארצות הברית ומערב אירופה. ו ISO 8859-5 הוא שולחן המשמש קירילית, כולל רוסית.

מסיבות היסטוריות רבות, תקן ISO 8859-5 לא שימש זמן רב.

עבור השפה הרוסית כרגע, קידוד משמש באמת:

  • CP866 (קוד 866) או DOS, אשר נקרא לעתים קרובות חלופה GOST קידוד. זה היה בשימוש פעיל עד אמצע שנות ה -90 של המאה הקודמת. כרגע, כמעט לא בשימוש.
  • קוי 8. הקידוד פותח בשנות ה -80 וה -70, וכרגע הוא תקן עבור הודעות דואר ב- RuNet. הוא נמצא בשימוש נרחב במערכת ההפעלה של משפחת יוניקס, כולל לינוקס. הגרסה ה"רוסית "של KOI-8 נקראת KOI-8R. בנוסף, ישנן גרסאות עבור שפות קיריליות אחרות, למשל, אוקראינית.
  • קוד 1251 (CP 1251, Windows - 1251). הוא פותח על ידי Microsoft Corporation כדי לספק תמיכה בשפה הרוסית בסביבת Windows.

היתרון העיקרי של CP866 תקן הראשון היה שימור של תווים pseudographic באותן עמדות כמו המורחבת ASCII. זה מותר להפעיל תוכניות טקסט ללא שינוי, ייצור זר, כגון מפקד נורטון המפורסם. נכון לעכשיו, CP866 משמש עבור תוכניות שפותחו תחת Windows שפועלים במצב טקסט מסך מלא או בחלונות טקסט, כולל מנהל FAR.

טקסטים ממוחשבים שנכתבו בקידוד CP866 הם נדירים למדי לאחרונה, אבל הוא משמש שמות קבצים רוסית Vindous.

"Unicode"

כרגע, קידוד זה הוא הנפוץ ביותר. קודי Unicode מחולקים לאזורים. הראשון (מ- U + 0000 ל- U + 007F) כולל את התווים של ערכת ASCII עם קודים. לאחר מכן בצע את האזורים של סימנים של סקריפטים לאומיים שונים, כמו גם סימני פיסוק וסמלים טכניים. בנוסף, חלק מקודי Unicode שמורות במקרה שיש צורך לכלול סמלים חדשים בעתיד.

עכשיו אתה יודע כי קידוד ASCII, כל תו מיוצג כשילוב של 8 אפסים ואלו. ללא מומחים, מידע זה עשוי להיראות מיותר ולא מעניין, אבל אתה לא רוצה לדעת מה קורה "במוח" של המחשב שלך?

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 iw.birmiss.com. Theme powered by WordPress.