Java Excel Reader示例详解

简介

在Java开发中，处理Excel文件是一项常见的任务。无论是从Excel文件中读取数据用于业务逻辑处理，还是将处理结果写入Excel文件进行数据展示，都需要借助特定的库来实现。本文将围绕Java Excel Reader示例展开，详细介绍如何使用Java读取Excel文件，包括基础概念、使用方法、常见实践以及最佳实践，帮助读者掌握这一重要的开发技能。

基础概念
- Excel文件格式
- Java Excel读取库
使用方法
- 引入依赖
- 简单读取Excel文件示例
- 处理不同Excel版本
常见实践
- 读取特定单元格数据
- 遍历工作表和行
- 数据类型处理
最佳实践
- 性能优化
- 错误处理与异常捕获
- 代码结构与可维护性
小结

基础概念

Excel文件格式

Excel文件有多种格式，常见的有 .xls（Excel 97 - 2003 二进制文件格式）和 .xlsx（Office Open XML 格式）。.xls 格式基于BIFF（Binary Interchange File Format），而 .xlsx 是基于XML的压缩文件格式。了解这些格式的差异对于选择合适的Java库以及处理文件时的性能优化至关重要。

Java Excel读取库

在Java中，有多个库可以用于读取Excel文件，其中比较常用的有Apache POI和JExcelAPI。

Apache POI：是一个开源的Java库，支持操作各种Microsoft Office格式文件，包括Excel。它提供了丰富的API来读取、写入和修改Excel文件。POI支持新旧两种Excel文件格式，功能强大且文档完善。
JExcelAPI：也是一个用于Java的Excel处理库，相对简单易用，不过它对Excel 2007及以上版本（.xlsx 格式）的支持有限。

在本文中，我们将以Apache POI为例进行讲解。

使用方法

引入依赖

首先，需要在项目中引入Apache POI的依赖。如果使用Maven，可以在 pom.xml 文件中添加以下依赖：

<dependencies>
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi</artifactId>
        <version>5.0.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>5.0.0</version>
    </dependency>
</dependencies>

如果使用Gradle，可以在 build.gradle 文件中添加：

implementation 'org.apache.poi:poi:5.0.0'
implementation 'org.apache.poi:poi-ooxml:5.0.0'

简单读取Excel文件示例

下面是一个使用Apache POI读取Excel文件的简单示例：

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

public class ExcelReaderExample {
    public static void main(String[] args) {
        String filePath = "path/to/your/excel/file.xlsx";
        try (FileInputStream fis = new FileInputStream(new File(filePath));
             Workbook workbook = new XSSFWorkbook(fis)) {

            // 获取第一个工作表
            Sheet sheet = workbook.getSheetAt(0);

            // 遍历行
            for (Row row : sheet) {
                // 遍历单元格
                for (Cell cell : row) {
                    String cellValue = getCellValue(cell);
                    System.out.print(cellValue + "\t");
                }
                System.out.println();
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    private static String getCellValue(Cell cell) {
        if (cell == null) {
            return "";
        }

        switch (cell.getCellType()) {
            case STRING:
                return cell.getStringCellValue();
            case NUMERIC:
                if (DateUtil.isCellDateFormatted(cell)) {
                    return cell.getDateCellValue().toString();
                } else {
                    return String.valueOf(cell.getNumericCellValue());
                }
            case BOOLEAN:
                return String.valueOf(cell.getBooleanCellValue());
            case FORMULA:
                return cell.getCellFormula();
            default:
                return "";
        }
    }
}

处理不同Excel版本

上述示例处理的是 .xlsx 格式的文件。如果要处理 .xls 格式的文件，只需将 XSSFWorkbook 替换为 HSSFWorkbook：

import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.*;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

public class ExcelReaderXlsExample {
    public static void main(String[] args) {
        String filePath = "path/to/your/excel/file.xls";
        try (FileInputStream fis = new FileInputStream(new File(filePath));
             Workbook workbook = new HSSFWorkbook(fis)) {

            // 获取第一个工作表
            Sheet sheet = workbook.getSheetAt(0);

            // 遍历行
            for (Row row : sheet) {
                // 遍历单元格
                for (Cell cell : row) {
                    String cellValue = getCellValue(cell);
                    System.out.print(cellValue + "\t");
                }
                System.out.println();
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    private static String getCellValue(Cell cell) {
        if (cell == null) {
            return "";
        }

        switch (cell.getCellType()) {
            case STRING:
                return cell.getStringCellValue();
            case NUMERIC:
                if (DateUtil.isCellDateFormatted(cell)) {
                    return cell.getDateCellValue().toString();
                } else {
                    return String.valueOf(cell.getNumericCellValue());
                }
            case BOOLEAN:
                return String.valueOf(cell.getBooleanCellValue());
            case FORMULA:
                return cell.getCellFormula();
            default:
                return "";
        }
    }
}

常见实践

读取特定单元格数据

要读取特定单元格的数据，可以通过指定行号和列号来获取单元格。例如，读取第一行第二列的单元格数据：

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

public class SpecificCellReader {
    public static void main(String[] args) {
        String filePath = "path/to/your/excel/file.xlsx";
        try (FileInputStream fis = new FileInputStream(new File(filePath));
             Workbook workbook = new XSSFWorkbook(fis)) {

            Sheet sheet = workbook.getSheetAt(0);
            Row row = sheet.getRow(0);
            Cell cell = row.getCell(1);
            String cellValue = getCellValue(cell);
            System.out.println("第一行第二列的单元格数据: " + cellValue);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    private static String getCellValue(Cell cell) {
        if (cell == null) {
            return "";
        }

        switch (cell.getCellType()) {
            case STRING:
                return cell.getStringCellValue();
            case NUMERIC:
                if (DateUtil.isCellDateFormatted(cell)) {
                    return cell.getDateCellValue().toString();
                } else {
                    return String.valueOf(cell.getNumericCellValue());
                }
            case BOOLEAN:
                return String.valueOf(cell.getBooleanCellValue());
            case FORMULA:
                return cell.getCellFormula();
            default:
                return "";
        }
    }
}

遍历工作表和行

在实际应用中，可能需要遍历整个Excel文件的所有工作表和行。以下是一个示例：

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

public class SheetAndRowTraversal {
    public static void main(String[] args) {
        String filePath = "path/to/your/excel/file.xlsx";
        try (FileInputStream fis = new FileInputStream(new File(filePath));
             Workbook workbook = new XSSFWorkbook(fis)) {

            int numberOfSheets = workbook.getNumberOfSheets();
            for (int i = 0; i < numberOfSheets; i++) {
                Sheet sheet = workbook.getSheetAt(i);
                System.out.println("工作表名称: " + sheet.getSheetName());

                for (Row row : sheet) {
                    for (Cell cell : row) {
                        String cellValue = getCellValue(cell);
                        System.out.print(cellValue + "\t");
                    }
                    System.out.println();
                }
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    private static String getCellValue(Cell cell) {
        if (cell == null) {
            return "";
        }

        switch (cell.getCellType()) {
            case STRING:
                return cell.getStringCellValue();
            case NUMERIC:
                if (DateUtil.isCellDateFormatted(cell)) {
                    return cell.getDateCellValue().toString();
                } else {
                    return String.valueOf(cell.getNumericCellValue());
                }
            case BOOLEAN:
                return String.valueOf(cell.getBooleanCellValue());
            case FORMULA:
                return cell.getCellFormula();
            default:
                return "";
        }
    }
}

数据类型处理

Excel单元格可以包含不同的数据类型，如字符串、数字、日期、布尔值等。在读取数据时，需要正确处理这些数据类型。上述示例中的 getCellValue 方法已经展示了如何处理常见的数据类型。

最佳实践

性能优化

批量读取：避免逐行逐单元格读取，尽量一次性读取较大的数据块，减少I/O操作次数。
缓存数据：对于频繁访问的数据，可以考虑缓存到内存中，提高读取效率。
使用合适的API：根据实际需求选择合适的API方法，例如，使用 Sheet.getRowIterator 代替 Sheet.getRows 可以减少内存占用。

错误处理与异常捕获

在读取Excel文件时，可能会遇到各种错误，如文件不存在、格式错误等。应合理捕获和处理这些异常，提供友好的错误提示信息，增强程序的稳定性。

代码结构与可维护性

模块化代码：将读取Excel文件的逻辑封装成独立的方法或类，提高代码的复用性和可维护性。
注释和文档：为关键代码添加注释，说明代码的功能和目的，方便其他开发人员理解和维护。

小结

本文围绕Java Excel Reader示例，详细介绍了从基础概念到最佳实践的各个方面。通过引入Apache POI库，我们学习了如何读取不同格式的Excel文件，处理特定单元格数据、遍历工作表和行以及处理不同的数据类型。同时，我们还探讨了性能优化、错误处理和代码结构等最佳实践。希望这些内容能够帮助读者在Java开发中更加高效地处理Excel文件读取任务。

以上博客内容详细介绍了Java Excel Reader的相关知识和实践，希望对你有所帮助。如果你有任何问题或建议，欢迎在评论区留言。