Java 中逐行读取文件

简介

在 Java 编程中，经常需要处理文件数据。逐行读取文件是一种常见的操作，它允许我们对文件中的每一行数据进行单独的处理和分析。无论是处理配置文件、日志文件还是其他文本文件，掌握逐行读取文件的技术都至关重要。本文将详细介绍在 Java 中逐行读取文件的基础概念、使用方法、常见实践以及最佳实践。

基础概念

在 Java 中，文件是一种外部存储设备，用于持久化数据。逐行读取文件意味着每次从文件中读取一行文本，直到文件末尾。这一过程涉及到文件的打开、读取和关闭操作。Java 提供了多种方式来实现逐行读取文件，每种方式都有其优缺点和适用场景。

使用方法

使用 BufferedReader

BufferedReader 是 Java IO 包中的一个类，它提供了缓冲机制，可以提高文件读取的效率。以下是使用 BufferedReader 逐行读取文件的示例代码：

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;

public class BufferedReaderExample {
    public static void main(String[] args) {
        String filePath = "example.txt";
        try (BufferedReader br = new BufferedReader(new FileReader(filePath))) {
            String line;
            while ((line = br.readLine()) != null) {
                System.out.println(line);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

在上述代码中： 1. 我们创建了一个 BufferedReader 对象，并将其与 FileReader 关联，FileReader 用于读取指定路径的文件。 2. 使用 try-with-resources 语句来确保 BufferedReader 在使用完毕后会自动关闭，即使发生异常也能正确释放资源。 3. 在 while 循环中，使用 br.readLine() 方法逐行读取文件内容，直到文件末尾（readLine() 返回 null）。

使用 Scanner

Scanner 是 Java 中的一个实用类，用于解析基本类型和字符串。它也可以用于逐行读取文件。以下是使用 Scanner 逐行读取文件的示例代码：

import java.io.File;
import java.io.FileNotFoundException;
import java.util.Scanner;

public class ScannerExample {
    public static void main(String[] args) {
        String filePath = "example.txt";
        try {
            Scanner scanner = new Scanner(new File(filePath));
            while (scanner.hasNextLine()) {
                String line = scanner.nextLine();
                System.out.println(line);
            }
            scanner.close();
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        }
    }
}

在上述代码中： 1. 创建了一个 Scanner 对象，并将其与指定路径的文件关联。 2. 使用 while 循环和 scanner.hasNextLine() 方法检查是否还有下一行数据。 3. 使用 scanner.nextLine() 方法读取每一行数据。 4. 最后，手动调用 scanner.close() 方法关闭 Scanner，以释放资源。

使用 Files.lines()（Java 8+）

Java 8 引入了 Files.lines() 方法，它返回一个 Stream<String>，可以方便地逐行读取文件。以下是使用 Files.lines() 逐行读取文件的示例代码：

import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.stream.Stream;

public class FilesLinesExample {
    public static void main(String[] args) {
        String filePath = "example.txt";
        try (Stream<String> lines = Files.lines(Paths.get(filePath))) {
            lines.forEach(System.out::println);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

在上述代码中： 1. 使用 Files.lines(Paths.get(filePath)) 方法获取一个 Stream<String>，其中每个元素代表文件中的一行。 2. 使用 try-with-resources 语句确保 Stream 在使用完毕后自动关闭。 3. 使用 forEach 方法对 Stream 中的每一行数据进行打印输出。

常见实践

处理文件不存在的情况

在读取文件之前，最好先检查文件是否存在，以避免 FileNotFoundException。以下是一个示例：

import java.io.File;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.stream.Stream;

public class FileExistsExample {
    public static void main(String[] args) {
        String filePath = "example.txt";
        File file = new File(filePath);
        if (file.exists() && file.isFile()) {
            try (Stream<String> lines = Files.lines(Paths.get(filePath))) {
                lines.forEach(System.out::println);
            } catch (IOException e) {
                e.printStackTrace();
            }
        } else {
            System.out.println("文件不存在或不是一个文件。");
        }
    }
}

读取大文件

当处理大文件时，BufferedReader 是一个不错的选择，因为它的缓冲机制可以减少磁盘 I/O 操作。另外，使用 Files.lines() 结合 parallel() 方法可以利用多核 CPU 进行并行处理，提高读取效率。以下是一个示例：

import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.stream.Stream;

public class LargeFileExample {
    public static void main(String[] args) {
        String filePath = "largeFile.txt";
        try (Stream<String> lines = Files.lines(Paths.get(filePath)).parallel()) {
            lines.forEach(System.out::println);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

最佳实践

资源管理

无论使用哪种方法读取文件，都要确保及时关闭资源，以避免资源泄漏。try-with-resources 语句是一个很好的选择，它可以自动关闭实现了 AutoCloseable 接口的资源。

性能优化

对于小文件，Scanner 可能更方便，但对于大文件，BufferedReader 或 Files.lines() 结合并行处理通常更高效。
使用缓冲机制可以减少磁盘 I/O 操作，提高读取性能。
避免在循环中进行过多的复杂操作，尽量将处理逻辑移到循环外部。

小结

在 Java 中，逐行读取文件有多种方法，每种方法都有其特点和适用场景。BufferedReader 适用于大多数情况，尤其是处理大文件时；Scanner 更适合简单的文件读取和数据解析；Files.lines() 则利用了 Java 8 的流特性，提供了简洁的代码实现。在实际应用中，要根据文件大小、处理逻辑和性能要求选择合适的方法，并注意资源管理和性能优化。