逐字符读取文本文件

在本节中，你将学会如何逐字符读取文本文件，这是一个非常少见的需求，除非你想创建文本编辑器。相关的Go代码参考byCharacter.go，将分为四部分介绍。

byCharacter.go第一部分代码如下：

package main

import (
	"bufio"
	"flag"
	"fmt"
	"io"
	"os"
)

如你所见，本程序不需要使用正则表达式。

byCharacter.go第二部分代码如下：

func charByChar(file string) error {
	var err error
	f, err := os.Open(file)
	if err != nil {
		return err
	}
	defer f.Close()

	r := bufio.NewReader(f)
	for {
		line, err := r.ReadString('\n')
		if err == io.EOF {
			break
		} else if err != nil {
			fmt.Printf("error reading file %s", err)
			return err
		}

byCharacter.go第三部分代码如下：

		for _, x := range line {
			fmt.Println(string(x))
		}
	}
	return nil
}

此处，你读取每一行，并使用range分割。range返回两个值：丢弃第一个值，它是line变量中当前字符的位置，并使用第二个值。但是，该值不是字符-这就是为什么必须使用string()函数将其转换为字符的原因。

注意，由于fmt.Println(string(x))语句，每个字符都按行打印，这意味着程序的输出将很大。如果想要压缩输出，应该使用fmt.Print()函数。

byCharacter.go的最后一部分代码如下：

func main() {
	flag.Parse()
	if len(flag.Args()) == 0 {
		fmt.Printf("usage: byChar <file1> [<file2> ...]\n")
		return
	}

	for _, file := range flag.Args() {
		err := charByChar(file)
		if err != nil {
			fmt.Println(err)
		}
	}
}

执行byCharacter.go会产生如下输出：

$ go run byCharacter.go /tmp/adobegc.log
0
1
/
0
8
/
1
8

注意，上述Go代码也能用来统计输入文件的字符个数，即是Go版本的wc(1)命令行实现。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

08.5.3.md

08.5.3.md

逐字符读取文本文件

Files

08.5.3.md

Latest commit

History

08.5.3.md

File metadata and controls

逐字符读取文本文件