免费三级毛片免费三级岁,欧美日韩国产精品一区二区三区,国产一级欧美精品大片免费看

windows和linux、Mac系統(tǒng)換行規(guī)則的區(qū)別

作者：西西點(diǎn)擊：262次評(píng)論：0次標(biāo)簽：換行

LineDrop清除錯(cuò)誤FTP傳輸換行符V2.0.0英文綠色免費(fèi)版

類型：編程輔助大小：23KB語言：英文評(píng)分：5.0
標(biāo)簽：

立即下載

在計(jì)算機(jī)還沒有出現(xiàn)之前，有一種叫做電傳打字機(jī)（Teletype Model 33）的玩意，每秒鐘可以打10個(gè)字符。但是它有一個(gè)問題，就是打完一行換行的時(shí)候，要用去0.2秒，正好可以打兩個(gè)字符。要是在這0.2秒里面，又有新的字符傳過來，那么這個(gè)字符將丟失。

于是，研制人員想了個(gè)辦法解決這個(gè)問題，就是在每行后面加兩個(gè)表示結(jié)束的字符。一個(gè)叫做"回車"，告訴打字機(jī)把打印頭定位在左邊界；另一個(gè)叫做"換行"，告訴打字機(jī)把紙向下移一行。

這就是"換行"和"回車"的來歷，從它們的英語名字上也可以看出一二。

后來，計(jì)算機(jī)發(fā)明了，這兩個(gè)概念也就被般到了計(jì)算機(jī)上。那時(shí)，存儲(chǔ)器很貴，一些科學(xué)家認(rèn)為在每行結(jié)尾加兩個(gè)字符太浪費(fèi)了，加一個(gè)就可以。于是，就出現(xiàn)了分歧。

Unix系統(tǒng)里，每行結(jié)尾只有"<換行>"，即"\n"；Windows系統(tǒng)里面，每行結(jié)尾是"<回車><換行>"，即"\r\n"；Mac系統(tǒng)里，每行結(jié)尾是"<回車>"。一個(gè)直接后果是，Unix/Mac系統(tǒng)下的文件在Windows里打開的話，所有文字會(huì)變成一行；而Windows里的文件在Unix/Mac下打開的話，在每行的結(jié)尾可能會(huì)多出一個(gè)^M符號(hào)。

因此在linux下創(chuàng)建的文本文件在windows中會(huì)連成一行，因?yàn)閣indows認(rèn)為沒有換行符（CRLF）。
在windows下創(chuàng)建的文本文件在linux中可能會(huì)出現(xiàn)每一行后面多了一個(gè)^M，這個(gè)^M要用ctrl + v ctrl + m打出，代表的意思就是CR(Carriage Return).

說到這里有人也許會(huì)問，為什么我在windows下創(chuàng)建的文本文件，在linux中顯示正常呢？

例如，我在windows下創(chuàng)建一個(gè)文本文件a.txt，放到我的linux中，用vim打開

可以看到顯示結(jié)果正常，行的結(jié)尾并沒有^M符號(hào)。這是因?yàn)関im在打開文件時(shí)，會(huì)自動(dòng)檢測換行符，如果文本的所有換行符都是^M$(CRLF, 即windows的換行標(biāo)記)，那么vim會(huì)自動(dòng)以dos格式顯示文本內(nèi)容，忽略掉每一行結(jié)尾的^M$，因此文本顯示是正常的。

注意上面我圖片的兩個(gè)箭頭指示的vim編輯器最下方的兩個(gè)標(biāo)志[noeol]和[dos]，先來解釋第二個(gè)標(biāo)志"[dos]"，這表示vim識(shí)別到文本的每一行都是^M$的換行符，因此vim自動(dòng)以dos文本格式來顯示文件。所以我們看到文本顯示是正常的。

那么為什么有的時(shí)候windows下創(chuàng)建或編輯的文件在linux下會(huì)出現(xiàn)^M呢，vim不是能自動(dòng)識(shí)別嗎？這是因?yàn)�，vim會(huì)檢查文本的每一行換行符，只要有一行的換行符不是windows格式，那么vim就會(huì)以u(píng)nix文件格式來顯示文件，這時(shí)換行符為$, 因此我們會(huì)看到文本的行后面多了一個(gè)^M符號(hào)。

這里我用cat -A顯示文件的特殊符號(hào)：

文件一共四行，可以看換行符都是^M$（箭頭所指），因此vim會(huì)用[dos]文件格式來顯示這個(gè)文本。
這里還可以發(fā)現(xiàn)文件的最后一行沒有換行符，這就是第一張圖vim中的[noeol]標(biāo)志的由來，因?yàn)樵趙indows下處理的文本，最后一行是不會(huì)加上換行符的，而linux下創(chuàng)建的文本的規(guī)則是每一行都有換行符，包括最后一行。因此vim會(huì)提示no end-of-line, 告訴我們這個(gè)文件包含沒有換行符結(jié)束的行。

用wc -l統(tǒng)計(jì)這個(gè)文件的行數(shù)：

結(jié)果是3行，少了一行，原因是文件的最后一行沒有換行符。

我在linux下用vim編輯一個(gè)新文件，內(nèi)容和剛剛的a.txt一樣，用cat -A查看：

可以看到linux下創(chuàng)建的文本，每一行都是有換行符的，包括最后一行，用wc -l統(tǒng)計(jì)行數(shù)：

這時(shí)統(tǒng)計(jì)結(jié)果正確。

再用sed替換windows下創(chuàng)建的a.txt, 將其中一行的換行符^M$中的^M去掉，變成linux的換行符$

這里我把文件的第二行的換行符替換成了linux格式的$，注意sed命令中的^M
在命令行中不是直接輸入，而是 ctrl+v和ctrl+m. 再用vim打開這個(gè)文件：

由于第二行的換行符不是^M$格式，vim不會(huì)以dos文件格式來顯示文件按，可以發(fā)現(xiàn)vim下方?jīng)]有[dos]的提示了，表明vim以u(píng)nix文件格式來顯示這個(gè)文件，因此一些行的后面會(huì)多了一個(gè)^M標(biāo)志。

補(bǔ)充：sed對(duì)windows換行符的處理

通過上面可以知道vim對(duì)于一個(gè)全部使用windows格式換行符的文本文件會(huì)以[dos]模式來顯示這個(gè)文本，自動(dòng)忽略行尾的^M.

博主在使用sed命令處理一些文件時(shí)，會(huì)出現(xiàn)一個(gè)本來顯示正常的文件，被sed處理之后，再打開文件時(shí)發(fā)現(xiàn)再次出現(xiàn)討厭的^M. 那么sed是如何處理windows換行符的文本呢？

先在windows下創(chuàng)建一個(gè)文本文件，傳至我的linux中。用cat -A 顯示特殊字符：

這里看到最后一行沒有換行符，其他行的換行符為^M$, 使用sed處理這個(gè)文本文件，向第二行添加一些內(nèi)容，再用cat -A查看：

這里我用.*匹配第二行的所有內(nèi)容，&表示匹配到的所有內(nèi)容，在&后面我加上了一些內(nèi)容，用cat -A查看發(fā)現(xiàn)，sed在處理替換時(shí)，如果匹配到整個(gè)行，那么匹配的內(nèi)容是除了換行符$(Linux 換行符)外的所有內(nèi)容，即使這個(gè)文本的換行符是^M$(windows 換行符).

因此第二行的文本被sed處理后，^M被我的正則表達(dá)式.*當(dāng)作文本內(nèi)容而匹配到了，而$不會(huì)被匹配，永遠(yuǎn)在行的末尾充當(dāng)換行符，這樣一來^M和$就被拆散了。因此這一行的換行符在處理后成為了linux格式的換行符$. 用vim打開的效果如下：

因?yàn)槲募膿Q行符是linux和windows混雜的，vim以u(píng)nix文件格式顯示這個(gè)文件，文件的^M被顯示出來，并且第二行的^M被sed匹配到，因而不在行尾。vim下方的[noeol]原因是最后一行在windows下沒有換行符，因此也沒有^M.

得出結(jié)論：sed會(huì)把文件中的^M當(dāng)作文件內(nèi)容來處理，因此如果用sed處理windows下創(chuàng)建的文本文件，很有可能在處理之后顯示時(shí)出現(xiàn)討厭的^M. 關(guān)于其他的文本處理器如何處理windows的換行符，還有待進(jìn)一步研究。

小結(jié)：

windows下創(chuàng)建的文件換行符為^M$，但最后一行結(jié)尾沒有換行符

linux下創(chuàng)建的文件，每一行都會(huì)以換行符$結(jié)束，包括最后一行

vim打開文件時(shí)，如果文件的所有換行符都是dos格式的^M$，那么vim會(huì)自動(dòng)以dos文件格式來顯示文本文件，否則會(huì)以默認(rèn)的unix格式顯示文本，這是可能會(huì)在行的結(jié)尾出現(xiàn)^M的符號(hào)

wc -l是以$換行符來統(tǒng)計(jì)行數(shù)的，因此windows下創(chuàng)建的文件使用wc -l統(tǒng)計(jì)行數(shù)時(shí)會(huì)少一行

一個(gè)windows下創(chuàng)建的文件，在linux下顯示正常，但是用某些文本處理命令，如sed處理后，文件的某些換行符可能會(huì)改變，造成顯示不正常

sed處理文件時(shí)，會(huì)把windows換行符中的^M當(dāng)作文件內(nèi)容，即sed只保留$作為行末尾的換行符，因此可能會(huì)造成換行符不一致。