在开源平台中管理大数据需求
使用 Azure HDInsight(一项用于进行开源分析的可自定义企业级服务)运行常见的开源框架,包括 Apache Hadoop、Spark、Hive 和 Kafka 等。凭借 Azure 的全球规模,可轻松处理海量数据并享受广泛的开源项目生态系统的所有优势。轻松地将大数据工作负载和处理迁移到云。
无需安装硬件或管理基础结构,即可轻松地快速启动开源项目和群集
大数据群集通过自动缩放和定价层降低成本,使你只需为所使用的内容付费
企业级安全性和行业领先的合规性(具有 30 多项认证)有助于保护你的数据
针对开源技术(如 Hadoop 和 Spark)的优化组件使你随时了解最新情况
在开源生态系统中生成项目
及时了解最新版本的开源框架,包括 Kafka、HBase 和 Hive LLAP。HDInsight 支持来自 Apache Hadoop 和 Spark 生态系统的最新开源项目。
与 Azure 服务进行原生集成
通过与 Azure 数据存储解决方案和服务(包括 Azure Synapse Analytics、Azure Cosmos DB、Azure Data Lake Storage、Azure Blob 存储、Azure 事件中心和 Azure 数据工厂)无缝集成来构建数据湖。通过从各种虚拟机中进行选择,并利用基于负载或计划的自动缩放功能来控制成本。使用 Azure Monitor 仪表板监视整个数据湖。
获得多种语言和工具的灵活性
使用首选的生产力工具,包括 Visual Studio、Eclipse、IntelliJ、Jupyter 和 Zeppelin。用 Scala、Python、R、JavaScript 和 .NET 等熟悉的语言编写代码。
内置的全面的安全性和合规性
-
Microsoft 每年在网络安全研发方面的投资超过 USD 10 亿。
-
我们雇佣了3,500 多名安全专家,专门负责数据安全和隐私方面的工作。
通过 Azure 免费帐户开始使用
2
用完额度后,请改为即付即用定价以继续使用相同的免费服务构建自己的内容。只需为超出每月免费金额以外的部分付费。
3
HDInsight 资源和文档
通过学习资源开始使用
有关 HDInsight 的常见问题解答
-
如果使用自定义代码通过最新的大数据处理框架(如 Spark、Hadoop、Hive、Kafka 或 Hbase)处理和分析超大型数据集,则会从 Azure HDInsight 中获益。通过 Azure HDInsight,你可以完全控制群集的配置以及安装在群集上的软件。如果要从本地环境或其他云迁移 Hortonworks、Cloudera 或 MapR 群集,也可以考虑使用 HDInsight。
-
Azure HDInsight 可用于大数据处理的各种场景。大数据可以是历史数据(已收集和存储的数据),也可以是实时数据(直接从源流式传输的数据)。处理此类数据的场景可以归纳为以下几类:批处理 (ETL)、数据仓库、物联网 (IoT)、数据科学和混合。
-
若要了解有关 HDInsight 群集类型和预配方法的详细信息,请阅读有关如何使用 Apache Hadoop、Apache Spark、Apache Kafka 等在 HDInsight 中设置群集的文档。