Write a Case Study Using ChatGPT#

Q1#

我是一名 AWS 解决方案架构师. 我想写一篇 Case Study 来介绍我曾经帮助一个视频服务平台的企业用户, 使用 AWS Step Functions 这一 Serverless 的编排服务, 优化了它们后台的视频处理流程. 使得一个 1 小时的视频从被上传到可被消费的时间平均从 1 小时缩短到了 5 分钟, 提升了用户体验, 使得该企业在同行业中获得领先地位. 除此之外, 我还使得该企业花在视频处理计算上的成本降低了 50%.

我希望你能用 STAR (Situation, Task, Action, Result) 框架, 写一个完整的 Case Study 的故事. 我希望你能先给我提供一份大纲. 在 STAR 的每个主题下提到至少 2 - 3 个小点.

A1#

  • 情景 (Situation)
    • 企业背景: 介绍该视频服务平台企业的规模、用户基础和视频处理流程。

    • 挑战描述: 阐述该企业在视频处理方面所面临的挑战,包括处理时间长、用户体验差和成本高等问题。

  • 任务 (Task)
    • 识别需求: 分析企业需求,确定需要优化视频处理流程以提高效率和用户体验。

    • 选择解决方案: 探索不同的解决方案,确定采用 AWS Step Functions 作为优化视频处理流程的最佳方案。

  • 行动 (Action)
    • 架构设计: 详细描述如何设计并实施基于 AWS Step Functions 的视频处理流程优化方案。

    • 开发与集成: 解释如何开发和集成 Step Functions,以及与其他 AWS 服务(如 Lambda、S3)的协作。

  • 结果 (Result)
    • 性能提升: 说明通过 Step Functions 优化后,视频处理时间从上传到可消费的平均时间大幅缩短的具体数据。

    • 用户体验改善: 强调优化后的视频处理流程如何提升了用户体验,促进了用户满意度的提升。

    • 成本节约: 介绍通过使用 Step Functions 优化后,视频处理计算成本降低了 50% 的具体数字。

通过以上大纲,您可以更轻松地编写一份详细的 Case Study,展示您在解决方案架构方面的专业能力以及对客户业务的贡献。

Q2#

我想用 2 个小段落来分别描述 企业背景 和 挑战描述. 我用 bullet 的格式来列出我认为重要的点, 请你用完整的段落来将其串联为一小段文章. 我希望你用 Restructured Text 的格式返回. 下面是我列出的 Bullet

  • 企业背景:
    • 是一个以企业客户为主的视频服务平台

    • 它的主要服务是帮助企业对会议的视频文件进行处理, 然后提供附加价值. 这些价值有:
      • 自动识别不同人的声音, 将其分类.

      • 将声音转化为文本, 并根据声音识别的结果生成字幕.

      • 对声音文字内容进行索引, 并允许用户模糊搜索文本并跳转到视频的特定位置.

      • 对图像界面进行分析, 对于长期停留的画面将其视为重要内容.

      • 对重要的图像内容进行文本提取, 以及 Diagram 提取, 并进行图像增强.

      • 对图像内容中的文本进行索引, 并允许用户模糊搜索文本并跳转到视频的特定位置.

      • 对视频内容进行总结, 生成一段 200 字左右的摘要, 并且以 bullet 的形式展示, 让用户可以点击 bullet 跳转到视频的对应位置.

      • 将视频相关的所有信息储存到企业用户的视频知识库中.

    • 这个公司有大约 200 多个企业用户, 每天需要处理大约 50000 小时的视频 (每个企业平均一天产生 250 小时的视频).

    • 目前的用来做视频处理的计算单元是一个安装了 AI 算法的容器对视频进行处理. 大部分的功能都是用这个容器来处理的. 小部分的功能例如声音转化文本, 从图像中提取文本等则是异步调用 AWS 服务.

    • 目前在执行整个 workflow 的流程的逻辑是企业早期的 AI 专家用 Python 中的 for, while loop, if else 实现的.

    • 这个容器的配置大约是 16vCPU, 64GB内存, 平均处理一个 1 小时的视频大约需要花费 1 小时.

    • 目前花在计算的 Cost 大约是平均每处理一小时的数据花费 0.286 美元:
      • 注: 按照 AWS ECS Fargate Pricing, 16vCPU, 64GB 内存 的配置, 每小时 CPU 的花费是 16 * 0.01241385 = 0.1986216, 内存花费是 64 * 0.00136313 = 0.08724032, 一共是每小时 0.1986216 + 0.08724032 = 0.28586192.

      • 注: 这里没有包括一些 AWS 的 AI 服务例如 AWS Transcribe, AWS Rekognition 的费用. 这两个的费用大约是每小时 Transcribe 用来语音转文本是 0.6 美元, Rekognition 用来 Detect Text 花费 1 美元 (分析 1000 个关键帧图像). 也就是一共 1.6 美元.

      • 注: 对企业用户的收费大约是每处理 1 小时的视频收费 5 美元.

CPU 的花费是 50000 * 16 * 0.01241385 = 9931, 内存的花费是 50000 * 64 * 0.00136313 = 4362, 每个月是 (9931 + 4362) * 30 = 429K, 每年是 429K * 12 = 5.1M), - 挑战描述:

  • 视频处理流程复杂. 包含了多个步骤, 且这些步骤之前存在依赖关系.

  • 每个步骤的耗时不一样, 且对于不同的视频的同一个步骤, 有的时候这个步骤耗时长, 有的时候耗时短.

  • 客户还在不断高速增长中, 未来的处理量会更大, 目前的系统可能无法满足未来增长的需求.