在S3中查询Presto中的JSON文件文件、Presto、JSON

由网友(月光倾城)分享简介:我在S3中有一个文件,Presto在EMR上运行。我明白了,我可以使用json_Extract来读取json。我正在运行以下查询,但是,我总是看到空值而不是正确值。select json_extract('s3a://random-s3-bucket/analytics/20210221/myjsonfile.js...

我在S3中有一个文件,Presto在EMR上运行。我明白了,我可以使用json_Extract来读取json。

我正在运行以下查询,但是,我总是看到空值而不是正确值。

select json_extract('s3a://random-s3-bucket/analytics/20210221/myjsonfile.json', '$.dateAvailability')
数据藏在json文件中,如何爬取 以王者荣耀官网为例

我看到此输出

不确定我的语法是否错误?想法?

推荐答案

json_extract()对内存中保存的JSON标量值进行操作。它不从外部位置加载数据。有关用法示例,请参阅文档页面。

为了使用Trino(formerly known as Presto SQL)查询JSON文件,您需要将其映射为JSON格式的表,如下所示:

CREATE TABLE my_table ( .... )
WITH (
    format = 'JSON',
    external_location = 's3a://random-s3-bucket/analytics/20210221'
);

请参阅Hive connector documentation中的详细信息。

阅读全文

相关推荐

最新文章