Golang 如何逐词读取文件
在使用Go处理文件时,通常需要逐词读取文件。在本文中,我们将探讨如何在Golang中逐词读取文件。我们将讨论三种不同的方法来实现这个任务,并提供代码片段来演示每种方法。
方法1:使用bufio.NewScanner
第一种方法是使用bufio包及其NewScanner函数逐词读取文件。该函数接受一个io.Reader接口作为输入,并返回一个可以用于逐词扫描文件的Scanner对象。
示例
下面是一个演示这种方法的示例代码段-
package main
import (
"bufio"
"fmt"
"os"
)
func main() {
file, err := os.Open("filename.txt")
if err != nil {
panic(err)
}
defer file.Close()
scanner := bufio.NewScanner(file)
// Set the split function for the scanning operation.
scanner.Split(bufio.ScanWords)
// Scan all words from the file.
for scanner.Scan() {
fmt.Println(scanner.Text())
}
if err := scanner.Err(); err != nil {
panic(err)
}
}
在这个示例中,我们首先使用os
包打开文件并检查错误。然后,我们使用bufio
包创建一个新的扫描器,并将分割函数设置为bufio.ScanWords
以逐个单词读取文件。最后,我们循环遍历每个单词并将其打印到控制台上。
方法2:使用fmt.Fscanf
第二种方法是使用fmt
包及其Fscanf
函数逐个单词读取文件。该函数以io.Reader
接口作为输入,并返回成功扫描的项数。
示例
以下是一个示例代码片段,演示了这种方法 –
package main
import (
"fmt"
"os"
)
func main() {
file, err := os.Open("filename.txt")
if err != nil {
panic(err)
}
defer file.Close()
var word string
for {
_, err := fmt.Fscanf(file, "%s", &word)
if err != nil {
break
}
fmt.Println(word)
}
}
在这个示例中,我们首先使用os包打开文件并检查错误。然后我们创建一个名为word的变量,并使用fmt.Fscanf函数循环遍历文件,直到到达文件末尾。该函数扫描下一个单词并将其存储在word变量中,然后将其打印到控制台。
方法3:使用bufio.NewReader和strings.Fields
第三种方法是使用bufio包及其NewReader函数以及strings包及其Fields函数逐个读取文件中的单词。NewReader函数创建一个新的缓冲读取器,而Fields函数将字符串分割成单词。
示例
下面是一个演示该方法的示例代码片段 –
package main
import (
"bufio"
"fmt"
"os"
"strings"
)
func main() {
file, err := os.Open("filename.txt")
if err != nil {
panic(err)
}
defer file.Close()
reader := bufio.NewReader(file)
for {
line, err := reader.ReadString('\n')
if err != nil {
break
}
words := strings.Fields(line)
for _, word := range words {
fmt.Println(word)
}
}
}
在这个示例中,我们首先使用os包打开文件并检查错误。然后我们使用bufio包创建一个新的读取器,并使用reader.ReadString函数循环遍每一行文件。该函数会读取每一行文件,直到遇到换行符(\n)并将该行作为字符串返回。
然而,如果我们想逐个单词读取文件,则需要将每行分割成单词。为了做到这一点,我们可以使用Go语言中的strings包。
示例
让我们看一个在Go语言中逐个单词读取文件的示例−
package main
import (
"bufio"
"fmt"
"os"
)
func main() {
file, err := os.Open("test.txt")
if err != nil {
panic(err)
}
defer file.Close()
scanner := bufio.NewScanner(file)
scanner.Split(bufio.ScanWords)
for scanner.Scan() {
word := scanner.Text()
fmt.Println(word)
}
if err := scanner.Err(); err != nil {
panic(err)
}
}
在上面的示例中,我们首先使用os包打开文件并检查错误。然后我们使用bufio包创建一个新的scanner,并将其分割函数设置为bufio.ScanWords。这告诉scanner将输入拆分成单词。
接下来,我们使用scanner.Scan()函数循环遍历文件中的每个单词,该函数从输入中读取下一个单词,并在成功时返回true。然后我们使用scanner.Text()函数获取该单词并将其打印到控制台。
最后,我们使用scanner.Err()函数检查是否有错误。
结论
使用bufio包和strings包在Go语言中逐个单词读取文件很容易。通过使用bufio.ScanWords函数,我们可以将输入拆分成单词并循环遍历文件中的每个单词。