Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,569,302字

该文章投稿至Nemo社区   资讯  板块 复制链接


VMWare 推出开源 AI 分析平台 Greenplum 7,提升可扩展性及多负载处理能力

发布于 2023/10/13 18:03 232浏览 0回复 2,164

IT之家 10 月 13 日消息,据 VMWare 中国研发中心公众号发文,VMware Greenplum 7 目前已经正式推出,这是一个“统一分析和人工智能”平台,支持向量数据并行处理,号称“可与最新大语言模型方法(LLM)集成”、“能够可帮助企业充分利用其数据资源”

图片

▲ 图源 VMWare 中国研发中心

VMware 声称,Greenplum 核心是以开源 PostgreSQL 项目为基础,将商业智能(BI)和人工智能(AI)功能无缝集成在同一平台上,能够统一数据分析和人工智能需求,所有的操作都可以通过用户熟悉的 SQL 数据库界面来实现。

VMware 认为,Greenplum 在部署方面具有显著的灵活性,在数据处理上也有一定优势,能够管理“各种类型的数据”,此外还集成了增强的安全功能,从而使企业能够高效快速地应对复杂的挑战。

IT之家附 VMware Greenplum 7 主要更新内容如下:

开放源代码和 PostgreSQL 12 的衍生

VMware Greenplum 7 建立在开源代码的基础上,利用了现代 PostgreSQL 版本的功能、可靠性和灵活性。与前一版本相比,Greenplum 7 植根于 PostgreSQL 12,并整合了近 5 年以来 PostgreSQL 的发布版本。

多种索引类型

VMware Greenplum 7 支持多种索引类型,包括 B 树索引、哈希索引、位图索引、块范围索引、文本索引、地理空间索引和 AI 向量索引。该功能可优化数据检索和查询性能。Greenplum 查询优化器自 2009 年以来不断改进,在第 6 版中取得了良好的性能记录,在第 7 版中得到了扩展,提供了全面的索引选择支持。

利用 PXF 增强数据联合

VMware Greenplum 7 中的平台扩展框架(PXF) 经过改进,实现了卓越的数据联合。企业现在可以通过 JDBC 查询亚马逊简单存储服务(S3)对象存储、Hadoop 分布式文件系统(HDFS)和其他关系数据库中的数据集。它利用 PostgreSQL 的外来数据封装器 API 来并行访问远程数据源,提供抽象数据模型来管理远程数据的安全性和统计数据,以优化查询。

增强文本搜索

VMware Greenplum 7 扩展了文本搜索功能,同时支持词法搜索和人工智能驱动的语义搜索,以提供更准确的搜索结果。词法搜索支持基于关键字的传统文本搜索,对于语义搜索,则由人工智能和向量 embeddings 提供支持。

升级地理空间分析

VMware Greenplum 7 通过集成 PostGIS 版本 3 升级了地理空间分析功能。这一改进大大提高了地理空间查询的速度和特征丰富度。

行级安全权限

该功能是对 VMware Greenplum 中已有的基于角色的安全模型以及表级和列级权限的补充。

用于增强数据建模的生成列

VMware Greenplum 7 中引入了生成列,从而改进了数据抽象和建模,解决了安全特征保留数据屏蔽等用例问题。

改进的 DBA 查询功能

Greenplum 7 对 DBA 查询功能进行了大量改进,包括 UPSERT 支持、带有事务的用户定义函数,以及对 ALTER TABLE 的改进以减少数据重写。

增强的半结构化和非结构化数据分析

Greenplum 7 除支持 XML 文档外,还支持半结构化数据处理,如增强的 JSON 和数组数据处理功能。全文搜索和基于文本的词法搜索索引可实现高效的文本存储、索引和搜索。此外,向量嵌入可实现非结构化数据的浓缩和高效表示,允许跨多种语言对匹配的文档、图像和视频进行相似性搜索,包括多语言搜索。

PostgreSQL 扩展生态系统

更全面的 PostgreSQL 扩展支持,如高级密码检查、模糊字符串匹配、Hyperloglog、用于网络数据的 Ip4r、用于媒体数据的 Isn、纳秒时间戳、稀疏向量、用于透视的 Tablefunc、用于唯一标识符的 UUID 以及用于人工智能向量嵌入的 pg_vector,已全部支持。

先进的资源管理

Greenplum 7 引入了一系列高级资源管理功能。这些功能可确保在高负载情况下的稳健性能。

VMware vSphere 部署模型

Greenplum 7 可以参考推荐的架构部署在裸机或公共云环境中。也可利用 Greenplum 7 版本中提供的自动部署模式无缝集成到 vSphere 私有云环境中。

多数据中心灾难恢复解决方案

作为多数据中心灾难恢复解决方案的一部分,数据通过事务日志归档进行复制,从而实现比 Greenplum 以前版本更高效、更低的恢复点目标(RPO)和恢复时间目标(RTO)灾难恢复解决方案。

新的扩展 PostgresML

提供新的用户定义函数,使用户可以在 VMware Greenplum 中使用数以万计的开源人工智能 / 机器学习预训练模型。

参考

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/724/792.htm]

本文标签
 {{tag}}
点了个评