Write a Case Study Using ChatGPT#
Q1#
我是一名 AWS 解决方案架构师. 我想写一篇 Case Study 来介绍我曾经帮助一个视频服务平台的企业用户, 使用 AWS Step Functions 这一 Serverless 的编排服务, 优化了它们后台的视频处理流程. 使得一个 1 小时的视频从被上传到可被消费的时间平均从 1 小时缩短到了 5 分钟, 提升了用户体验, 使得该企业在同行业中获得领先地位. 除此之外, 我还使得该企业花在视频处理计算上的成本降低了 50%.
我希望你能用 STAR (Situation, Task, Action, Result) 框架, 写一个完整的 Case Study 的故事. 我希望你能先给我提供一份大纲. 在 STAR 的每个主题下提到至少 2 - 3 个小点.
A1#
- 情景 (Situation)
企业背景: 介绍该视频服务平台企业的规模、用户基础和视频处理流程。
挑战描述: 阐述该企业在视频处理方面所面临的挑战,包括处理时间长、用户体验差和成本高等问题。
- 任务 (Task)
识别需求: 分析企业需求,确定需要优化视频处理流程以提高效率和用户体验。
选择解决方案: 探索不同的解决方案,确定采用 AWS Step Functions 作为优化视频处理流程的最佳方案。
- 行动 (Action)
架构设计: 详细描述如何设计并实施基于 AWS Step Functions 的视频处理流程优化方案。
开发与集成: 解释如何开发和集成 Step Functions,以及与其他 AWS 服务(如 Lambda、S3)的协作。
- 结果 (Result)
性能提升: 说明通过 Step Functions 优化后,视频处理时间从上传到可消费的平均时间大幅缩短的具体数据。
用户体验改善: 强调优化后的视频处理流程如何提升了用户体验,促进了用户满意度的提升。
成本节约: 介绍通过使用 Step Functions 优化后,视频处理计算成本降低了 50% 的具体数字。
通过以上大纲,您可以更轻松地编写一份详细的 Case Study,展示您在解决方案架构方面的专业能力以及对客户业务的贡献。
Q2#
我想用 2 个小段落来分别描述 企业背景 和 挑战描述. 我用 bullet 的格式来列出我认为重要的点, 请你用完整的段落来将其串联为一小段文章. 我希望你用 Restructured Text 的格式返回. 下面是我列出的 Bullet
- 企业背景:
是一个以企业客户为主的视频服务平台
- 它的主要服务是帮助企业对会议的视频文件进行处理, 然后提供附加价值. 这些价值有:
自动识别不同人的声音, 将其分类.
将声音转化为文本, 并根据声音识别的结果生成字幕.
对声音文字内容进行索引, 并允许用户模糊搜索文本并跳转到视频的特定位置.
对图像界面进行分析, 对于长期停留的画面将其视为重要内容.
对重要的图像内容进行文本提取, 以及 Diagram 提取, 并进行图像增强.
对图像内容中的文本进行索引, 并允许用户模糊搜索文本并跳转到视频的特定位置.
对视频内容进行总结, 生成一段 200 字左右的摘要, 并且以 bullet 的形式展示, 让用户可以点击 bullet 跳转到视频的对应位置.
将视频相关的所有信息储存到企业用户的视频知识库中.
这个公司有大约 200 多个企业用户, 每天需要处理大约 50000 小时的视频 (每个企业平均一天产生 250 小时的视频).
目前的用来做视频处理的计算单元是一个安装了 AI 算法的容器对视频进行处理. 大部分的功能都是用这个容器来处理的. 小部分的功能例如声音转化文本, 从图像中提取文本等则是异步调用 AWS 服务.
目前在执行整个 workflow 的流程的逻辑是企业早期的 AI 专家用 Python 中的 for, while loop, if else 实现的.
这个容器的配置大约是 16vCPU, 64GB内存, 平均处理一个 1 小时的视频大约需要花费 1 小时.
- 目前花在计算的 Cost 大约是平均每处理一小时的数据花费 0.286 美元:
注: 按照 AWS ECS Fargate Pricing, 16vCPU, 64GB 内存 的配置, 每小时 CPU 的花费是 16 * 0.01241385 = 0.1986216, 内存花费是 64 * 0.00136313 = 0.08724032, 一共是每小时 0.1986216 + 0.08724032 = 0.28586192.
注: 这里没有包括一些 AWS 的 AI 服务例如 AWS Transcribe, AWS Rekognition 的费用. 这两个的费用大约是每小时 Transcribe 用来语音转文本是 0.6 美元, Rekognition 用来 Detect Text 花费 1 美元 (分析 1000 个关键帧图像). 也就是一共 1.6 美元.
注: 对企业用户的收费大约是每处理 1 小时的视频收费 5 美元.
CPU 的花费是 50000 * 16 * 0.01241385 = 9931, 内存的花费是 50000 * 64 * 0.00136313 = 4362, 每个月是 (9931 + 4362) * 30 = 429K, 每年是 429K * 12 = 5.1M), - 挑战描述:
视频处理流程复杂. 包含了多个步骤, 且这些步骤之前存在依赖关系.
每个步骤的耗时不一样, 且对于不同的视频的同一个步骤, 有的时候这个步骤耗时长, 有的时候耗时短.
客户还在不断高速增长中, 未来的处理量会更大, 目前的系统可能无法满足未来增长的需求.