查看: 302|回复: 0

[教程] Linux下如何处理文本文件内容中的^M

[复制链接]

10

主题

0

回帖

30

积分

技术1级

金币
20
阅读权限
10
精华
0
威望
0
贡献
0
在线时间
0 小时
注册时间
2011-1-6
QQ
发表于 2012-1-26 15:00:05 | 显示全部楼层 |阅读模式
Windows上写好的文件,在Linux或者Unix下打开,每一行都会出多出^M这样的字符,这是因为Windows与*nix的换行符不同所致,我们看看文件格式有什么不同。
在Linux下查看文件格式:
# file filename
# 20140304110001.csv: ISO-8859 text //不带有^M
# 20140304110002.csv: ISO-8859 text, with CRLF line terminators //带有^M
Windows下处理的文件就带有CRLF行终止符。
以下有几种处理方式:
1. vi命令行模式下输入
:%s/^M$//g # 去掉行尾的^M。
:%s/^M//g # 去掉所有的^M。
:%s/^M/[ctrl-v]+[enter]/g # 将^M替换成回车。
:%s/^M/\r/g # 将^M替换成回车。
2. 使用sed命令。和vi的用法相似:
# sed -e 's/^M/\n/g'filename
3. 使用命令
使用dos2unix命令,一般的*nix发布版本都带有这个小工具,即Windows - *nix文件转换。
格式: dos2unix filename
转换多个文件
格式:dos2unix file1 file2 file3 ….
上面转换文件的时候都会修改原来的文件,使用 -k参数,或者 -n参数可以不改变文件属性。
格式:dos2unix -n oldfile newfile //新建一个文件,保持源文件不变
格式:dos2unix -k filename //保持文件时间戳不变
同样工具提供了*nix - windows文件格式转换命令:unix2dos,参数同dos2unix。
*注:"^M",需要使用Ctrl + V + Ctrl + M键入,而不是数字6上面的^+字母M。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

相关侵权、举报、投诉及建议等,请发 E-mail:qiongdian@foxmail.com

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.

在本版发帖返回顶部