欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

回车符和换行符区别

shiping1 的头像
记得在Windows下学X86汇编语言时,用0DH(\r)和0AH(\n)来输出回车(跳到下一行的开始处)。问题来了,在Windows  (\r\n)下是先回车再换行呢还是先换行再回车呢?在Unix系统下换行只有\n,MAC OS下只有\r(网上是这么说的, 没用过Mac OS, 无从证实),都不会出现上述的问题。

现在新建一个文本文档,其内容如下:

现在用C语言二进制形式将其读入字符串(可以参考我的一篇文章:深入C语言把文件读入字符串以及将字符串写入文件的解决方法)并按十进制输出。结果如下

可以看出回车是13和10也就是\r\n,即先回车后换行。

下面我们看看将a和b之间的\r\n互换后会是什么效果:


来自 http://www.jb51.net/article/36732.htm





回车符和换行符区别

    首先介绍一下“回车”(carriage return,’\r’)“换行”(line feed,’\n’)这两个概念的来历和区别。在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。 

    后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧:

  • Unix 系统里,每行结尾只有“<换行>”,即“\n”;
  • Windows系统里面,每行结尾是“<回车><换行>”,即“\r\n”;
  • Mac系统里,每行结尾是“<回车>”,即“\r”。

    一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。一些常见的转义字符如下图:

    需要注意的是:在Windows系统中回车键被当做\r\n 的组合来使用,当我们从键盘输入回车键时,Windows系统会把回车键当做\r\n 来处理,Unix系统只会当做\n 来处理,不管在什么系统中,都可以用\n来作为一行输入结束的标记,只是在编程时我们需要注意,在Windows系统中我们会读到\r 这个字符,我们必须把\r和正常输入的字符区别开来。

    Windows与Unix文件格式是不同的,问题一般就是出在\r\n问题上。回车(CR)和换行(LF)符都是用来表示“下一行”的。而标准没有规定要使用哪一个。于是产生了三种不同的用法:

  • windows采用回车+换行(CR+LG)表示下一行(亦即所谓的PC格式)
  • UNIX采用换行符(LF)表示下一行
  • MAC机采用回车符(CR)表示下一行

当在不同的系统间传递文件,就要涉及格式的转换。

两种文件格式之间的转化:

1、 Unix -> Windows:'\n' -> '\r\n'  

while ( (ch = fgetc(in)) != EOF )

{

    if ( ch == '\n' )

       putchar('\r');

    putchar(ch);

}

只要在Unix文件中出现的'\n'的之前加入一个'\r'字符就可以了

2、Unix <- Windows'\n' <- '\r\n'
Windows到Unix的情况复杂点,不能只是把从文件中读出的'\r'去掉就可以了。因为Windows文件中的文本行的末尾有时会内嵌一个回车符号,这种情况在击打式打印机中出现。所以在转换前要判断'\r'是否和'\n'同时出现。如果同时出现,则去掉'\r',如果没有同时出现,保留'\n'。  

cr_flag = 0;    /* No CR encountered yet */

while ( (ch = fgetc(in)) != EOF )

{

    if ( cr_flag && ch != '\n' ) {

    /* This CR did not preceed LF */

       putchar('\r');

    }

    if ( !(cr_flag = (ch == '\r')) )

       putchar(ch);

}

来自 http://www.cnblogs.com/utank/p/4347059.html


\r是回车符,\n是换行符,各个系统的换行标志:
win                   用   \r\n
linux/unix            用   \n
Mac   OS              用   \r
CR用符号'\r'表示, 十进制ASCII代码是13, 十六进制代码为OxOD
LF使用'\n'符号表示, ASCII代码是10, 十六制为0x0A
所以:
Windows下用的是OAOD,即CR&LF,
linux/unix用的是OA,即LF
MacOS用的是OD,即CR
 
来历:
    计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。
    于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。
    后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。Unix 系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<回车><换行>”,即“ \r\n”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。
 
问题一:Windows下编写的纯文本文档在Linux下使用,例如Windows下编写的SH脚本,放到Linux下执行可能会出错。
 
解决方法:不用系统记事本,自己下载一个Ultraedit或者Notepad++文本编辑器,在Ultraedit下将该文件执行“File->conversions->Dos to Unix”,执行这个转化后的sh文件能够直接在linux下执行。这步操作能够就是将\r\n转换成\n。
 
方法二:
在windows下将txt文件保存为ANSI格式,然后在Linux终端输入:
cat ms.txt | col -b > linux.txt
 
方法三:我的另一个方法
***********************************************
利用cat -v test.txt可以显示test.txt中的\r(显示为^M),然后去掉^M即可。
输入:
cat -v test.txt >te.txt
然后cat te.txt可见行尾有^M,即\r。我们把^M去掉即可:
vi te.txt
在vi中输入替换命令
:%s/\^M//g
再保存即可。
***********************************************
 
 
问题二:Linux下新建的文档在Windows下用记事本打开内容会挤在一起(没有了换行符)。原因是记事本不支持\n换行(它只支持\r\n形式的换行)。
 
解决方法:在Windows中使用Ultraedit或者Notepad++文本编辑器,执行转换。
 
另外,有两个偏方:
1)在Windows中把txt后缀改成doc或者c,用Word或VC6.0来打开,然后复制到txt文件中。
2)在Linux下新建文本文档的时候,不要用Vim或者Gedit,用Open Office,保存成doc格式。
 
打开文本文件可以用:
1)gedit xx.doc
2)vim xx.doc(vim可能不支持繁体字,如果不涉及繁体字以及古怪的符号,就可以用vim)
3)找到文件,直接用Open Office打开。选择字符集(系统),字符(SYSong18030),语言(中文简体),换段落:CR&LF(或者LF)。
 
注意:如果文件名是中文(比如vim 测试.txt),那有可能找不到,须要ls一下,然后复制文件名,然后再gedit 粘贴文件名。
 
1. CR&LF,即\r\n,这是Windows下记事本的格式,Linux是完全支持的;(推荐)
2. CR,即\r,记事本不支持,没有换行效果,也没有\r效果;Word下有换行效果,也有\r;
3. LF,即\n,linux/unix系统下的换行符。(shell脚本就需要这个格式)
 
PS:
    \r效果是:在每一行的末尾,默认的光标定位是下一行的行首,也就是说在行尾输入的内容实际上是下一行的行首,\r才是真正的换行,而\n是回车,原本指打字机的纸张往下移动一位,后来在Unix-like系统下,\n成为了实际上的换行符。\r和\n的区别看下面的例子就知道了:
    \n和\r在C语言中的用法:
#include <stdio.h>
int main()
{
    printf("938517\r10086\n");
    return 0;
}
无论是Linux系统还是Windows平台,输入均是
10086
    因为\r已经换行了,所以938517就不再显示了。而\n并不是真正意义上的换行,它实际上是把纸张(或屏幕)向下移动一位(以便显示下一行的内容)。
 
 
问题三:Windows下编写的doc文档,在Linux下查看(用Open Office)一般都会乱码。
 
解决方法:先用Open Office打开,然后再全选,把字体设置为SYSong18030,OK中文简体和繁体都显示正常了。
 
 
问题四:在不同平台间使用FTP软件传送文件时, 在ascii文本模式传输模式下, 一些FTP客户端程序会自动对换行格式进行转换,经过这种传输的文件字节数可能会发生变化。
 
解决方法:如果你不想ftp修改原文件, 可以使用bin模式(二进制模式)传输文本。

来自 http://blog.chinaunix.net/uid-25908383-id-3031018.html
普通分类: