計(jì)算機(jī)在最初只支持ASCII編碼, 但是后來為了支持其他語言中的字符(比如漢字)以及一些特殊字符(比如€),就引入了Unicode字符集。基于Unicode字符集的編碼方式有很多, 比如UTF-7、UTF-8、Unicode以及UTF-32。在Windows操作系統(tǒng)中,一個(gè)文本文件的前幾個(gè)字節(jié)是用來指定該文件的編碼方式的。
如果你使用NotePad或WordPad來打開一個(gè)文本文件,你并不用擔(dān)心該文件的編碼方式,因?yàn)檫@些應(yīng)用程序會(huì)先讀取文件的前幾個(gè)字節(jié)來確定該 文件的編碼方式,然后用正確的編碼將文本中的每個(gè)字符顯示出來。下面的圖中,可以看到當(dāng)用NotePad記事本保存一個(gè)文檔時(shí),可以選擇的編碼(Encoding)方式有哪些。
用.Net 讀取文本文件或?qū)懭胛谋疚募愣疾豁氁獡?dān)心編碼方式。.Net已經(jīng)將這些封裝好了。在讀取一個(gè)文本文件的時(shí)候,如果你已經(jīng)知道文本使用的是什么編碼方 式,你可以指定使用哪種編碼方式讀取文本,否則如果不指定編碼方式,.Net會(huì)讀取文本的前幾個(gè)字節(jié)來確定使用哪種編碼方式讀取文件內(nèi)容的。在寫入文本文 件的時(shí)候,你也可以指定你想使用的編碼方式。如果你沒有指定編碼,.Net會(huì)根據(jù)寫入的文本是否含有特殊字符來決定編碼方式。如果沒有特殊字符,就采用 ASCII編碼,如果有特殊字符,就采用UTF-8編碼。
(一) 讀取文件
如果你要讀取的文件內(nèi)容不是很多,可以使用 File.ReadAllText(FilePath) 或指定編碼方式 File.ReadAllText(FilePath, Encoding)的方法。
//它們都一次將文本內(nèi)容全部讀完,并返回一個(gè)包含全部文本內(nèi)容的字符串
string str = File.ReadAllText(@"c:\temp\ascii.txt");
// 也可以指定編碼方式
string str2 = File.ReadAllText(@"c:\temp\ascii.txt", Encoding.ASCII);
//也可以使用方法File.ReadAllLines。該方法返回一個(gè)字符串?dāng)?shù)組。每一行都是一個(gè)數(shù)組元素。
string[] strs = File.ReadAllLines(@"c:\temp\ascii.txt");
// 也可以指定編碼方式
string[] strs2 = File.ReadAllLines(@"c:\temp\ascii.txt", Encoding.ASCII);
當(dāng)文本的內(nèi)容比較大時(shí),我們就不要將文本內(nèi)容一次讀完,而應(yīng)該采用流(Stream)的方式來讀取內(nèi)容。.Net為我們封裝了StreamReader類。初始化StreamReader類有很多種方式。下面我羅列出幾種:
StreamReader sr1 = new StreamReader(@"c:\temp\utf-8.txt");
// 同樣也可以指定編碼方式
StreamReader sr2 = new StreamReader(@"c:\temp\utf-8.txt", Encoding.UTF8);
FileStream fs = new FileStream(@"C:\temp\utf-8.txt", FileMode.Open, FileAccess.Read, FileShare.None);
StreamReader sr3 = new StreamReader(fs);
StreamReader sr4 = new StreamReader(fs, Encoding.UTF8);
FileInfo myFile = new FileInfo(@"C:\temp\utf-8.txt");
// OpenText 創(chuàng)建一個(gè)UTF-8 編碼的StreamReader對(duì)象
StreamReader sr5 = myFile.OpenText();
// OpenText 創(chuàng)建一個(gè)UTF-8 編碼的StreamReader對(duì)象
StreamReader sr6 = File.OpenText(@"C:\temp\utf-8.txt");
初始化完成之后,你可以每次讀一行,也可以每次讀一個(gè)字符 ,還可以每次讀幾個(gè)字符,甚至也可以一次將所有內(nèi)容讀完。
// 讀一行
string nextLine = sr.ReadLine();
// 讀一個(gè)字符
int nextChar = sr.Read();
// 讀100個(gè)字符
int nChars = 100;
char[] charArray = new char[nChars];
int nCharsRead = sr.Read(charArray, 0, nChars);
// 全部讀完
string restOfStream = sr.ReadToEnd();
使用完StreamReader之后,不要忘記關(guān)閉它:sr.Closee();
假如我們需要一行一行的讀,將整個(gè)文本文件讀完,下面看一個(gè)完整的例子:
StreamReader sr = File.OpenText(@"C:\temp\ascii.txt");
string nextLine;
while ((nextLine = sr.ReadLine()) != null)
{
Console.WriteLine(nextLine);
}
sr.Close();
(二) 寫入文件
寫 文件和讀文件一樣,如果你要寫入的內(nèi)容不是很多,可以使用File.WriteAllText方法來一次將內(nèi)容全部寫如文件。如果你要將一個(gè)字符串的內(nèi)容 寫入文件,可以用File.WriteAllText(FilePath) 或指定編碼方式 File.WriteAllText(FilePath, Encoding)方法。
string str1 = "Good Morning!";
File.WriteAllText(@"c:\temp\test\ascii.txt", str1);
// 也可以指定編碼方式
File.WriteAllText(@"c:\temp\test\ascii-2.txt", str1, Encoding.ASCII);
如果你有一個(gè)字符串?dāng)?shù)組,你要將每個(gè)字符串元素都寫入文件中,可以用File.WriteAllLines方法:
string[] strs = { "Good Morning!", "Good Afternoon!" };
File.WriteAllLines(@"c:\temp\ascii.txt", strs);
File.WriteAllLines(@"c:\temp\ascii-2.txt", strs, Encoding.ASCII);
使用File.WriteAllText或File.WriteAllLines方法時(shí),如果指定的文件路徑不存在,會(huì)創(chuàng)建一個(gè)新文件;如果文件已經(jīng)存在,則會(huì)覆蓋原文件。
當(dāng)要寫入的內(nèi)容比較多時(shí),同樣也要使用流(Stream)的方式寫入。.Net封裝的類是StreamWriter。初始化StreamWriter類同樣有很多方式:
// 如果文件不存在,創(chuàng)建文件; 如果存在,覆蓋文件
StreamWriter sw1 = new StreamWriter(@"c:\temp\utf-8.txt");
// 也可以指定編碼方式
// true 是 append text, false 為覆蓋原文件
StreamWriter sw2 = new StreamWriter(@"c:\temp\utf-8.txt", true, Encoding.UTF8);
// FileMode.CreateNew: 如果文件不存在,創(chuàng)建文件;如果文件已經(jīng)存在,拋出異常
FileStream fs = new FileStream(@"C:\temp\utf-8.txt", FileMode.CreateNew, FileAccess.Write, FileShare.Read);
// UTF-8 為默認(rèn)編碼
StreamWriter sw3 = new StreamWriter(fs);
StreamWriter sw4 = new StreamWriter(fs, Encoding.UTF8);
// 如果文件不存在,創(chuàng)建文件; 如果存在,覆蓋文件
FileInfo myFile = new FileInfo(@"C:\temp\utf-8.txt");
StreamWriter sw5 = myFile.CreateText();
初始化完成后,可以用StreamWriter對(duì)象一次寫入一行,一個(gè)字符,一個(gè)字符數(shù)組,甚至一個(gè)字符數(shù)組的一部分。
// 寫一個(gè)字符
sw.Write('a');
// 寫一個(gè)字符數(shù)組
char[] charArray = new char[100];
// initialize these characters
sw.Write(charArray);
// 寫一個(gè)字符數(shù)組的一部分
sw.Write(charArray, 10, 15);
同樣,StreamWriter對(duì)象使用完后,不要忘記關(guān)閉。sw.Close(); 最后來看一個(gè)完整的使用StreamWriter一次寫入一行的例子:
FileInfo myFile = new FileInfo(@"C:\temp\utf-8.txt");
StreamWriter sw = myFile.CreateText();
string[] strs = { "早上好", "下午好" };
foreach (var s in strs)
{
sw.WriteLine(s);
}
sw.Close();
該文章在 2024/6/1 17:46:54 編輯過