跳到主要内容
返回使用场景

Codex 使用场景

清理并准备杂乱数据

处理表格数据且不影响原始文件。

简单5 分钟数据知识工作

概览

拖入或提及一个杂乱的 CSV 或电子表格,描述你看到的问题,并让 Codex 在保持原始文件不变的情况下写出一份清理后的副本。

清理一个副本

清理 @marketplace-risk-rollout-export.csv。

存在的问题:
- 日期格式混用了 MM/DD/YYYY 和 YYYY-MM-DD
- 货币值包含 $、逗号和空白单元格
- 有几行重复的客户记录来自重复导出
- region 和 category 名称使用了多个别名
- 数据中混入了粘贴进去的汇总行

我的要求:
- 写出一个清理后的 CSV
- 保持原始文件不变
- 使用统一的日期格式
- 保持空白货币单元格为空白
- 尽可能保留源行 ID
- 添加一份简短的数据质量说明,列出你修改、删除或无法有把握清理的行

建议推理强度:

简介

Codex 非常擅长系统性地清理表格数据。 当 CSV 或电子表格中包含混合日期、重复行、货币字符串、空白单元格、别名或粘贴进去的汇总行时,可以让 Codex 清理一份副本,并保持原始文件不变。

使用方法

  1. 将文件拖入 Codex,或在提示词中提及它,例如 @customer-export.csv
  2. 描述你已经发现的问题。
  3. 告诉 Codex 清理后的版本应该是什么:CSV、电子表格标签页,或可直接上传的文件。
  4. 在使用之前先检查清理后的副本。

第一次清理时可使用本页的入门提示词。把文件名和项目符号替换成你自己的内容。真正有用的细节是你已经看到的问题,以及你接下来需要的文件:清理后的 CSV、干净的电子表格标签页,或可直接上传的文件。Codex 写出清理后的副本后,在下游使用数据之前,先打开清理后的文件以及该对话线程中的数据质量说明。