SAP-C02 学习助手

SAP-C02 第 281 题

S3 Redshift

题目

A company is collecting a large amount of data from a fleet of IoT devices. Data is stored as Optimized Row Columnar (ORC) files in the Hadoop Distributed File System (HDFS) on a persistent Amazon EMR cluster. The company's data analytics team queries the data by using SQL in Apache Presto deployed on the same EMR cluster. Queries scan large amounts of data, always run for less than 15 minutes, and run only between 5 PM and 10 PM. The company is concerned about the high cost associated with the current solution. A solutions architect must propose the most cost-effective solution that will allow SQL data queries. Which solution will meet these requirements?

中文翻译:
一家公司正在从一组物联网设备收集大量数据。数据作为优化行列式 (ORC) 文件存储在持久 Amazon EMR 集群上的 Hadoop 分布式文件系统 (HDFS) 中。该公司的数据分析团队使用部署在同一 EMR 集群上的 Apache Presto 中的 SQL 查询数据。查询会扫描大量数据,运行时间始终少于 15 分钟,并且仅在下午 5 点到晚上 10 点之间运行。该公司担心当前解决方案的高成本。解决方案架构师必须提出最具成本效益的解决方案,以允许 SQL 数据查询。哪种解决方案可以满足这些要求?

选项

A. Store data in Amazon S3. Use Amazon Redshift Spectrum to query data.

中文翻译:
将数据存储在 Amazon S3 中。使用 Amazon Redshift Spectrum 查询数据。

B. Store data in Amazon S3. Use the AWS Glue Data Catalog and Amazon Athena to query data.

中文翻译:
将数据存储在 Amazon S3 中。使用 AWS Glue 数据目录和 Amazon Athena 查询数据。

C. Store data in EMR File System (EMRFS). Use Presto in Amazon EMR to query data.

中文翻译:
将数据存储在 EMR 文件系统 (EMRFS) 中。在 Amazon EMR 中使用 Presto 查询数据。

D. Store data in Amazon Redshift. Use Amazon Redshift to query data.

中文翻译:
将数据存储在 Amazon Redshift 中。使用 Amazon Redshift 查询数据。

答案

B

解析

正确答案:B 解析: 本题应选择 B。 正确选项: B. 将数据存储在 Amazon S3 中。使用 AWS Glue 数据目录和 Amazon Athena 查询数据。 选择理由: 该选项最直接地满足题干中的关键约束。做 SAP-C02 题目时,需要同时对照题干里的限定词,例如最高性能、最低运维开销、成本效益、可靠性、可扩展性、安全性、RTO/RPO、合规要求等。本题相关考点主要包括:S3、Redshift。 排除思路: A、C、D ...

登录后查看完整解析