关键词:
【中文标题】Data Lake Store 的流分析可能的输出路径前缀【英文标题】:Stream Analytics possible output path prefix for Data Lake Store 【发布时间】:2017-05-31 20:38:56 【问题描述】:有没有办法在流分析作业中设置输出路径前缀,将数据存储到 Data Lake Store 以将其存储到单独的文件(取决于设备 ID)中,例如 data/2017/5/3/device1.csv ,data/2017/5/3/device2.csv ...或者在流分析将数据存储到一个文件之后,最好的方法是什么? 我的输入文件是 iot hub。
【问题讨论】:
【参考方案1】:有没有办法在流分析作业中设置输出路径前缀,将数据存储到 Data Lake Store 以将其存储到单独的文件(取决于设备 ID)中,例如 data/2017/5/3/device1.csv , 数据/2017/5/3/device2.csv.
根据document,根据我的理解,我们可以设置输出路径前缀为date/time,并且不要求必须使用变量。
似乎不支持使用动态设备 ID 设置输出路径。 如果可以创建多个流分析作业,我们可以创建流分析作业并使用静态设备 ID 作为路径前缀添加输出。
【讨论】:
需要使用 Azure 流分析和 IoT Hub 将数据存储到 Azure Data Lake Store:数据必须按 4MB 缓冲区存储
】需要使用Azure流分析和IoTHub将数据存储到AzureDataLakeStore:数据必须按4MB缓冲区存储【英文标题】:NeedtoStoredataintoAzureDatalakeStoreusingAzureStreamAnalyticsandIoTHub:Datamustbestoredby4MBbuffer【发布时间】:2018-04-0915:14:05【问题描述】:我需要... 查看详情
hdfs dfs -setfacl 在 Azure Data Lake Store 上失败
】hdfsdfs-setfacl在AzureDataLakeStore上失败【英文标题】:hdfsdfs-setfaclfailsonAzureDataLakeStore【发布时间】:2019-10-2413:19:49【问题描述】:我正在尝试使用以下命令从HDInsight3.6群集更改位于AzureDataLakeStoreGen1中的文件的访问控制列表:hdfsdfs... 查看详情
Usql 与 Azure Data Lake Store .net SDK
】Usql与AzureDataLakeStore.netSDK【英文标题】:UsqlwithAzureDataLakeStore.netSDK【发布时间】:2017-10-0611:00:06【问题描述】:您能否建议我可以将一起使用。实际上我需要将一些文件上传到数据湖存储,所以我需要使用AzureDataLakeStoreSDK,并... 查看详情
Azure Data Lake 是不是仅临时存储用于分析的数据?
】AzureDataLake是不是仅临时存储用于分析的数据?【英文标题】:DoesAzureDataLakeStoreDataforAnalyticsontemporarilypurposeonly?AzureDataLake是否仅临时存储用于分析的数据?【发布时间】:2017-04-1407:57:32【问题描述】:我正在学习MVA“介绍AzureDa... 查看详情
使用 Azure 数据工厂将数据从 Google Big Query 移动到 Azure Data Lake Store
】使用Azure数据工厂将数据从GoogleBigQuery移动到AzureDataLakeStore【英文标题】:MovingdatafromGoogleBigQuerytoAzureDataLakeStoreusingAzureDataFactory【发布时间】:2018-02-2614:30:09【问题描述】:我有一个场景,我需要在GoogleBigQuery中连接Azure数据工... 查看详情
如何在 C# 中使用服务主体(clientId 和 clientSecret)为 Azure Data Lake Store(Gen-2)创建 SAS 令牌?
...何在C#中使用服务主体(clientId和clientSecret)为AzureDataLakeStore(Gen-2)创建SAS令牌?【英文标题】:HowtocreateSAStokenforAzureDataLakeStore(Gen-2)usingserviceprincipals(clientIdandclientSecret)inC#?【发布时间】:2020-06-3012:00:06【问题描述】:我有DataLa... 查看详情
使用 Azure 数据工厂 (ADF) 数据流 (DF) 从/向 Azure Data Lake Store gen1 发送和接收数据
】使用Azure数据工厂(ADF)数据流(DF)从/向AzureDataLakeStoregen1发送和接收数据【英文标题】:SourceandSinkdatafrom/toAzureDataLakeStoregen1withAzuredatafactory\'s(ADF)DataFlow(DF)【发布时间】:2019-10-1904:42:52【问题描述】:我有一个AzureDataLakeStoregen1(ADLS... 查看详情
使用 Elastic Stack 对 Azure Data Lake Storage Gen2 中的数据进行实时数据分析
...使用ElasticStack对AzureDataLakeStorageGen2中的数据进行实时数据分析【英文标题】:RealtimedataanalyticsusingElasticStackondataresidinginAzureDataLakeStorageGen2【发布时间】:2021-10-1104:56:22【问题描述】:当数据驻留在AzureDataLakeStorageGen2上时,我们如... 查看详情
通过 Azure Data Lake 和 Power BI 进行数据分析(加入 mongoDB 和 SQL 数据)
】通过AzureDataLake和PowerBI进行数据分析(加入mongoDB和SQL数据)【英文标题】:Dataanalytics(joinmongoDBandSQLdata)throughAzureDataLakeandpowerBI【发布时间】:2020-09-1503:49:09【问题描述】:我们有一个使用mongoDB(在VM上运行)和AzureSQLdbs托管在A... 查看详情
带有 azure 函数输出的流分析,错误写入批次
】带有azure函数输出的流分析,错误写入批次【英文标题】:Streamanalyticswithazurefunctionoutput,errorwritingbatches【发布时间】:2018-10-1512:12:32【问题描述】:我得到了一个流分析输出到Azure函数的设置,这部分工作。在LogAnalytics中,我... 查看详情
具有 Blob 存储输入的流分析作业未连续运行
】具有Blob存储输入的流分析作业未连续运行【英文标题】:streamanalyticsjobwithblobstorageinputnotrunningcontinously【发布时间】:2017-11-0717:51:21【问题描述】:我创建了一个流分析作业,它从输入blob存储JSON、数据流中进行查询,并将其... 查看详情
来自 azure 流分析的流数据
】来自azure流分析的流数据【英文标题】:StreamDatafromazurestreamanalytics【发布时间】:2017-07-1500:21:07【问题描述】:我有来自天蓝色流分析的实时数据。我已启用历史数据,因为我想在仪表板中查看历史事件。但是,我需要在仪表... 查看详情
搜索存储在 Azure Data Lake 中的数据
】搜索存储在AzureDataLake中的数据【英文标题】:SearchingthroughdatastoredinAzureDataLake【发布时间】:2020-01-0709:38:30【问题描述】:我有以下用于构建数据湖的用例(例如在Azure中):我的组织与濒临破产的公司打交道。一旦公司破产... 查看详情
Databricks:Data Lake Storage Gen 2 的挂载和直接访问之间的区别
】Databricks:DataLakeStorageGen2的挂载和直接访问之间的区别【英文标题】:Databricks:differencebetweenmountanddirectaccessofDataLakeStorageGen2【发布时间】:2019-10-0211:44:08【问题描述】:使用服务主体在Databricks上安装AzureDataLakeStoreGen2和使用SAS... 查看详情
将数据从 Csv 文件自动获取到 Data Lake 的最佳方法
】将数据从Csv文件自动获取到DataLake的最佳方法【英文标题】:BestwaytoautomatategettingdatafromCsvfilestoDatalake【发布时间】:2017-09-1215:17:49【问题描述】:我需要从csv文件(每天从不同的业务数据库中提取)获取数据到HDFS,然后将其... 查看详情
来自 Data Lake Gen2 的 Power BI 流数据集
】来自DataLakeGen2的PowerBI流数据集【英文标题】:PowerBIStreamingDatasetfromDataLakeGen2【发布时间】:2020-05-1210:51:36【问题描述】:我们将传感器数据作为.json文件推送到数据湖中。频率是每分钟发送一个.json文件。我想将PowerBIStreamDatase... 查看详情
有啥方法可以检查我的流分析输入是不是已经在表中?
】有啥方法可以检查我的流分析输入是不是已经在表中?【英文标题】:IsthereanywaytocheckifmyStreamAnalyticsinputisalreadyinatable?有什么方法可以检查我的流分析输入是否已经在表中?【发布时间】:2020-01-2311:28:46【问题描述】:我有一... 查看详情
将 PySpark Dataframe 导出到 Azure Data Lake 需要很长时间
】将PySparkDataframe导出到AzureDataLake需要很长时间【英文标题】:ExportingPySparkDataframetoAzureDataLakeTakesForever【发布时间】:2019-12-0713:49:33【问题描述】:当输入数据的大小(大约6GB)很小时,以下代码在MacOS(Python3.7)上的独立版本PySpa... 查看详情