全国咨询服务热线:
13916483753、15000332451
021-50656863
Talend大数据处理大数据分析
[ 大数据分析 ] [ 9/2/2018 ]
Talend是领先的开源集成软件供应商,让数据驱动企业。客户可以用任何速度连接到任何地方。 使用Talend连接大规模数据,从本地到云和批处理,数据或应用集成,Talend现在是支持AWS Redshift, S3的ETL工具。可以获得5倍的速度,而只需要1/5的成本。
图形化的界面,拖拉式的方式
无需代码可使用Hadoop、Spark、Spark Stream 和NoSQL数据库
轻松转换ETL任务到MR、Spark
轻松转换ETL任务到Real-Time
图形化操作界面,无需编码,丰富的图形化转换功能
共享的存储库,SVN/Git版本管理
内置的元数据模块,一次定义,反复使用
充分利用现有ETL技能,批量、模板程序开发的功能
本地Windows开发、测试,可直接部署到Server
ETL引擎并行分布,数据处理并行
支持批处理、变化、实时数据的处理
灵活随意的增减ETL引擎,并对数据不产生影响
和Hadoop平台进行无缝集成,将处理逻辑推向Hadoop平台
支持标准、MR、Spark、Spark Stream ETL程序的随意切换
可以最大化的利用Hadoop平台的资源
支持文本、XML文件
支持远程读取FTP数据文件
各种应用:SAP、大型机、Cloud等等
常见的RDBMS:Oracle、SQL Server、DB2、Sybase、Teradata等等
Hadoop平台应用:HDFS、Hive、Hbase、HCatalog、Pig、Sqoop等等
支持用户、用户组、角色的管理策略
支持对Kerberos & LDAP的无缝集成
支持单独Hadoop作业单独访问模式
支持使用用户级凭据调用Hadoop作业
支持使用身份验证协议的用户级安全协议
支持读、写、可执行的多层次权限管理模式
使用Talend Studio通过拖放用户界面去设计批处理、实时流集成
通过共享库、持续交付方式和自助数据准备来改善合作
使用原生Hadoop数据质量、数据匹配和机器学习,更好的揭示数据
利用大数据控制台集中管理和监控项目
实现从原先的批处理,到基于内存的大数据Hub无缝扩展