一個G等于多少M(一個G等于多少MB流量)
2024-01-14 19:19:39
本節主要講解以下內容:
- python代碼的運行方式
- 進制
- 計算機中的單位
- 編碼
- Python代碼的運行方式
- 腳本式
- 交互式
- 進制
計算機中底層所有數據都是一010101的形式存在(圖片,文本,視頻等)。
進制分為:二進制、八進制、十進制、十六進制
- 進制之間的轉換
- 計算機中的單位
- b(bit), 位
- B(byte),字節
- KB(Kilobyte),千字節
- M(Megabyte),兆
- G(Gigabyte),千兆
- T(Terabyte),萬億字節
- 其他更大單位的 PB/EB/ZB/YB/BB/NB/DB不再贅述。
- 假設1個漢字需要2個字節(2B=16位來表示,如:1000101011001100),那么1G流量可以通過網絡傳輸多少漢字呢?(計算機傳輸本質上也是二進制)
- 假設1個漢字需要2個字節(2B=16位來表示,如:1000101011001100),那么500G硬盤可以存儲多少個漢字?
- 編碼
編碼:文字和二進制之間的一個對照表。
4.1 ASCII編碼
ascii規定使用1個字節來表示字母與二進制的對應關系。
4.2 gb-2312編碼
gb-2312編碼,由國家信息標準委員會制作(1980年)。
gbk編碼,對gb2312進行擴展,包含了中日韓等文字(1995年)。
在與二進制做對應關系時,由如下邏輯:
- 單字節表示,用一個字節表示對應關系。2**8 = 256
- 雙字節表示,用兩個字節表示對應關系。2**16 = 65536中可能性。
4.3 Unicode
unicode也被稱為萬國碼,為全球的每個文字都分配了一個碼位(二進制表示)。
- ucs2
- ucs4
無論是ucs2和ucs4都有缺點:浪費空間?
unicode的應用:在文件存儲和網絡傳輸時,不會直接使用unicode,而在內存中會unicode。
4.4 utf-8編碼
包含所有文字和二進制的對應關系,全球應用最為廣泛的一種編碼,本質上:utf-8是對unicode的壓縮,用盡量少的二進制去與文字進行對應。
4.5 python相關的編碼
將一個字符串寫入到一個文件中
本節總結:本節的知識點主要以理解為主。
- 計算機上所有的東西最終都會轉換成為二進制再去運行。
- ascii編碼、unicode字符集、utf-8編碼本質上都是字符與二進制的關系。
- ascii,字符和二進制的對照表。
- unicode,字符和二進制(碼位)的對照表。
- utf-8,對unicode字符集的碼位進行壓縮處理,間接也維護了字符和二進制的對照表。
- ucs2和ucs4指的是使用多少個字節來表示unicode字符集的碼位。
- 目前最廣泛的編碼為:utf-8,他可以表示所有的字符且存儲或網絡傳輸也不會浪費資源(對碼位進行壓縮了)。
- 二進制、八進制、十進制、十六進制其實就是進位的時機不同。
- 基于Python實現二進制、八進制、十進制、十六進制之間的轉換。
- 一個字節8位
- 計算機中常見單位b/B/KB/M/G的關系。
- 漢字,用gbk編碼需要用2個字節;用utf-8編碼需要用3個字節。
- 基于Python實現將字符串轉換為字節(utf-8編碼)
13.基于Python實現將字符串轉換為字節(gbk編碼)
下一篇:最后一頁