Datafaker是用于生成类似生产数据的工具 – jworks.io


当需要真实的测试数据时,Datafaker 是一个很棒的库。例如,单元测试就是一个很好的例子,或者填充数据库表,或者生成 CSV 文件。使用 Datafaker,生成真实的数据(例如信用卡号码、电话号码)以及医疗数据(例如 ICD-10-CM 和 ICD-10-PCS 数据)非常简单。
生成数据作为匿名生产数据的替代方法,有一些好处。生成数据的最大好处之一是数据永远不会导致 PII(个人身份信息)和 PHI(受保护的健康信息)问题,因为数据是假的,并且不包含真实的患者、病历编号或其他识别信息。
另一个巨大的好处是很容易生成几乎无限的数据集。虽然有时很难获得大量匿名生产数据,但使用 Datafaker 可以轻松完成生成一百万或更多 PII/PHI 记录。
最后一个值得注意的特性是生成的数据可以本地化。因此,例如,当您需要美国电话号码和法国电话号码时,Datafaker 可以通过传入所需语言或国家/地区的语言环境轻松生成这些号码,并且数据将被相应地格式化。
使用 Datafaker 非常简单。它可以通过在 或 中声明依赖关系从 Maven 或 Gradle 中pom.xml使用build.gradle。一个例子可以在下面看到:

<dependency>
    <groupId>net.datafaker</groupId>
    <artifactId>datafaker</artifactId>
    <version>1.0.0</version>
</dependency>

导入库后,您可以使用 Datafaker 通过以下方式生成假数据:

import net.datafaker.Faker;

Faker faker = new Faker();

String name = faker.name().fullName(); // Miss Samanta Schmidt
String firstName = faker.name().firstName();
// Emory
String lastName = faker.name().lastName();
// Barton

String streetAddress = faker.address().streetAddress();
// 60018 Sawayn Brooks Suite 449