cloudera吧
关注: 79 贴子: 163

  • 3
    通过本课程的学习,可以掌握ClouderaManager的应用场景和使用规范,并可以学习到大型公司企业内部的大数据架构图。对大数据人员来讲,可以掌握企业级常用的Linux命令和快速安全的安装各类大数据组件及性能调优。
  • 1
    求借用cloudera可下载软件账号,有酬谢!
  • 4
    各位大神,请教一下关于cdh上hive的升级问题,我是小白,之前安装了cdh5.13上自带的hive组件,hive1.1.0,现在想升级到hive2+,请问哪位大神有没有相关经验?
  • 0
    cdh初始化时有 create table ... select 建表操作 MySQL复制集群无法支持,如何处理
  • 1
    centos安装CDH6.1出现这种错误,各种重装重启都没用,磁盘空间也是够够的 求大佬指点
  • 8
    【Cloudera ApacheHadoop管理员课程】 课时:4天 学习系统管理的概念和Apache Hadoop的最佳实践, 从安装和配置到负载均衡和调优。 这个4天的的课程通过动手时间来赋予你部署的经验, 以及更多的安全方面的经验和故障排除。 课程结束后,学员被鼓励去参加Cloudera和Apache Hadoop管理员(CCAH)考试。 【Cloudera ApacheHadoop开发者课程】 【Cloudera ApacheHadoop分析师课程】 相关请咨询我
  • 2
    CentOS7.5安装CDH6.1.0报这种错,不知道怎么处理,哪位大神知道解决办法,谢谢!
  • 3
    菜鸡学习CM遇到大坑,搞了一下午没搞定,无奈求救 启动agent服务报错: [01/Apr/2019 17:50:37 +0000] 32978 MainThread agent ERROR Failed to connect to previous supervisor. Traceback (most recent call last): File "/opt/cm-5.10.0/lib64/cmf/agent/build/env/lib/python2.7/site-packages/cmf-5.10.0-py2.7.egg/cmf/agent.py", line 2057, in find_or_start_supervisor self.get_supervisor_process_info() File "/opt/cm-5.10.0/lib64/cmf/agent/build/env/lib/python2.7/site-packages/cmf-5.10.0-py2.7.egg/cmf/agent.py", line 2201, in get_supervisor_process_info self.identi
    aqid2401 4-8
  • 2
    目前做数据可oracle管理,想深入了解下现在很火的大数据是怎么样的,需要什么样的基础才可以学。
  • 5
    《企业级CDH5平台实战》 著名互联网公司真实项目系统 http://www.keshare.com/pd.jsp?id=1&_pp=105_881
  • 3
    最新考试认证体系如下,需要运维证书的小伙伴请看最新考试形式
  • 0
    当cdh集群中已经有了某个jar包的高版本时,但程序需要该jar包的低版本时,如何把低版本的jar包放入集群供程序调用呢????不管是使用maven打包还是直接把低版本的jar包放入集群,但只要集群中有高版本的jar包程序就默认加载高版本的jar包,请问如何让程序调用我指定的低版本的jar包呢??????
  • 1
    File "/opt/cm-5.1.3/lib64/cmf/agent/src/cmf/agent.py", line 3, in <module> import argparse File "/opt/cm-5.1.3/lib64/cmf/agent/build/env/lib/python2.6/site-packages/argparse-1.1-py2.6.egg/argparse.py", line 92, in <module> import copy as _copy
  • 0
    版本都是5.6.1,在浏览器中配置到最后一步进行首次运行命令时,一直报这个错误,有知道的吧友吗?帮忙看看,感谢感谢!
  • 0
    各们大神,你们当中有用5.11版本的吗? 控制台管理界面打开超级慢
    nyaw0125 6-14
  • 1
    一、CCAH Administrator Hadoop管理员认证 认证准备建议:Hadoop管理员培训 考试形式:90分钟;70%通过;60道多项选择题(会提示是单选or多选) 培训内容 通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容: Cloudera Manager管理机群的特性,譬如日志汇总、配置管理、报告、报警及服务管理。 YARN、MapReduce、Spark及HDFS的工作原理。 如何为你的机群选取合适的硬件和架构。 如何将 Hadoop 机群和企业已有的系统进行无缝集成。 如何使用Flume 进行实时数
    艾小玲 4-14
  • 0
    进入parcel ,点击5.2.0激活 org.codehaus.jackson.map.JsonMappingException: Can not deserialize instance of com.cloudera.cmf.model.ParcelServicesRestartInfo out of START_ARRAY token at [Source: java.io.StringReader@3699bc13; line: 1, column: 1] cloudera-scm-server 日志 2017-02-23 16:20:27,528 INFO 1904297772@scm-web-1566:com.cloudera.parcel.components.ParcelManagerImpl: Determined obsoleted releases ( DbRelease{id=2, product=CDH, version=5.7.5-1.cdh5.7.5.p0.3} ) if release DbRelease{id=1, product=CDH, version=5.2.0-1.cdh5.2.0.p0.36} is activated.
  • 8
    http://blog.itpub.net/30089851/abstract/1/ http://blog.itpub.net/30089851/viewspace-2061399/
    dnanba1 8-23
  • 3
    http://tieba.baidu.com/p/4397234593?share=9105&fr=share
  • 17
    刷刷刷刷经验 刷刷刷 刷文字 刷刷刷刷经验 刷刷刷 刷文字 刷刷刷刷经验 刷刷刷 刷文字 刷刷刷刷经验 刷刷刷 刷文字 刷刷刷刷经验 刷刷刷 刷文字 刷刷刷刷经验 刷刷刷 刷文字 刷刷刷刷经验 刷刷刷 刷文字
  • 0
    知道这些不信你不会Mapreduce程序修复漏洞和优化性能所需要的技巧,下面一一说一下这些内容,学习这些内容的条件,以及学会这些知识对你的用处!! 【课程内容】: 1、MapReduce与HDFS内核知识以及如何编写MapReduce程序; 2、Hadoop开发的最佳实践,调试、实现工作流及通用算法; 3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的组件; 4、按需定制WritableComparables与InputFormats处理复杂的数据类型; 5、利用MapReduce编写、执行连接操作以整合不同数据集
  • 7
    现在市场上的手机、平板和PC五花八门,让人眼花缭乱不知道选哪一款好。苹果、Google、微软和亚马逊这互联网四大天王的产品通常会是用户首选,而用户作出选择的依据无非也就是看看硬件配置,还有操作系统。现在又有一个因素正在对用户的选择产生越来越大的影响,那就是产品配套的娱乐和服务生态系统。 今天要说的是四大巨头的娱乐生态系统,主要是指它们旗下的音乐、影视、电子书以及应用商店等数字内容商店的发展现状。 在我看来,一
  • 0
    大数据套件的数目在持续增长。你可以在几个开源和专有提供商之间选择。像IBM、Oracle、Microsoft等这样的大部分大软件提供商将某一类的大数据套件集成到自己的软件产品组合中。而绝大多数的这些厂商仅只支持某一个Hadoop发行版本,要么是自己的,要么和某个Hadoop发行版本提供商合作。 从另外一方面来看,还有专注于数据处理的提供商可供选择。它们提供的产品可用于数据集成、数据质量、企业服务总线、业务流程管理和更进一步的集成组件。既
  • 0
    你可以在Apache Hadoop或Hadoop发行版本之上使用一个大数据套件。大数据套件通常支持多个不同的Hadoop发行版本。然而,某些提供商实现了自己的Hadoop解决方案。无论哪种方式,大数据套件为了处理大数据而在发行版本上增加了几个更进一步的特性: 工具:通常,大数据套件是建立像Eclipse之类的IDE之上。附加插件方便了大数据应用的开发。你可以在自己熟悉的开发环境之内创建、构建并部署大数据服务。 建模:Apache Hadoop或Hadoop发行版本为Hadoop集群提供
  • 0
    由于发行版本具有打包、工具和商业支持这些优点,所以在绝大多数使用情形下都应使用Hadoop的发行版本。使用普通的(原文为plan,应为plain)Apache Hadoop发布版本并在此基础之上构建自己的发行版本的情况是极少见的。你会要自己测试打包,构建自己的工具,并自己动手写补丁。其他一些人已经遇到了你将会遇到的同样问题。所以,请确信你有很好的理由不使用Hadoop发行版本。 然而,就算是Hadoop发行版本也需要付出很大的努力。你还是需要为自己的M
  • 0
    本文不会评估各个Hadoop的发行版本。然而,下面会简短地介绍下主要的发行版本提供商。在不同的发行版本之间一般只有一些细微的差别,而提供商则将这些差别视为秘诀和自己产品的与众不同之处。下面的列表解释了这些差别: Cloudera:最成型的发行版本,拥有最多的部署案例。提供强大的部署、管理和监控工具。Cloudera开发并贡献了可实时处理大数据的Impala项目。 Hortonworks:不拥有任何私有(非开源)修改地使用了100%开源Apache Hadoop的唯一提供商
  • 0
    目前,除了Apache Hadoop外, HortonWorks、Cloudera和MapR三驾马车在发布版本上差不多齐头并进。虽然,在此期间也出现了其他的Hadoop发行版本。比如EMC公司的Pivotal HD、IBM的InfoSphere BigInsights。通过Amazon Elastic MapReduce(EMR),Amazon甚至在其云上提供了一个托管的、预配置的解决方案。 虽然很多别的软件提供商没有开发自己的Hadoop发行版本,但它们和某一个发行版本提供商相互合作。举例来说,Microsoft和Hortonworks相互合作,特别是合作将Apache Hadoop引入到Windows Ser
  • 0
    Hadoop发行版本解决了在上一节中所提到的问题。发行版本提供商的商业模型百分之百地依赖于自己的发行版本。他们提供打包、工具和商业支持。而这些不仅极大地简化了开发,而且也极大地简化了操作。 Hadoop发行版本将Hadoop生态系统所包含的不同项目打包在一起。这就确保了所有使用到的版本都可以顺当地在一起工作。发行版本会定期发布,它包含了不同项目的版本更新。 发行版本的提供商在打包之上还提供了用于部署、管理和监控Hadoop集群的图
  • 0
    由于在本地系统上,只需10分钟左右就可完成其独立安装,所以Apache Hadoop很适合于第一次尝试。你可以试试WordCount示例(这是Hadoop的“hello world”示例),并浏览部分MapReduce的Java代码 。 如果你并不想使用一个“真正的”Hadoop发行版本(请看下一节)的话,那么选择Apache Hadoop也是正确的。然而,我没有理由不去使用Hadoop的一个发行版本——因为它们也有免费的、非商业版。 所以,对于真正的Hadoop项目来说,我强烈推荐使用一个Hadoop的发行版本来代替Ap
  • 0
    Hadoop 利用 Sqoop 可以与 Informix 和 DB2 数据库很好地集成。Sqoop 是领先的开源实现,用于在 Hadoop 和关系数据库之间移动数据。它使用 JDBC 来读取和写入 Informix、DB2、MySQL、Oracle 和其他数据源。有几个数据库都有优化的适配器,包括 Netezza 和 DB2。
  • 1
    Apache Hadoop 项目有两个核心组件,被称为 Hadoop 分布式文件系统 (Hadoop Distributed File System, HDFS) 的文件存储,以及被称为 MapReduce 的编程框架。有一些支持项目充分利用了 HDFS 和 MapReduce。本文将提供一个概要,并鼓励您参阅 OReily 的书 “Hadoop The Definitive Guide”(第 3 版)了解更多详细信息。 下面的定义是为了提供足够的背景,让您可以使用随后的代码示例。本文的真正意义在于让您开始该技术的实践经验。这是一篇 “指南” 性质的文章,而不是一篇 “
  • 0
    有很多因素推动了围绕大数据的炒作,具体包括以下因素。 在商用硬件上结合计算和存储:其结果是以低成本实现惊人的速度。 性价比:Hadoop 大数据技术提供了显著的成本节约(系数大约为 10),以及显著的性能改进(同样,系数为 10)。您的成就可能会有所不同。如果现有的技术输得如此一塌糊涂,那么就值得研究 Hadoop 是否可以补充或取代您当前架构的某些方面。 线性可扩展性:每一个并行技术都声称可以垂直扩展。Hadoop 具有真正的可扩展性
  • 0
    大数据的数量庞大、捕获速度极快,且可以是结构化的也可以是非结构化的,或者是上述特点的某种组合。这些因素使得大数据难以使用传统的方法进行捕获、挖掘和管理。在该领域有如此多的炒作,以至于仅仅是大数据的定义就有可能是长期的争论战。 使用大数据技术并不局限于庞大的数量。本文中的示例使用小样本阐述该技术的功能。截至 2012 年,大 集群均在 100 PB 的范围内。 大数据既可以是结构化的,也可以是非结构化的。传统的关系型数据
  • 2
    1. 安装前的准备 准备好Ubuntu离线source,配置/etc/apt/source.list 准备好Cloudera Hadoop离线source,配置/etc/apt/source.list.d/cloudera.list 同步集群的/etc/hosts ssh免密码登录,cloudera-scm-server所在机器能够免密码登录其他cloudera-scm-agent机器或者所有机器的root用户密码相同

  • 发贴红色标题
  • 显示红名
  • 签到六倍经验

赠送补签卡1张,获得[经验书购买权]

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!

本吧信息 查看详情>>

会员: 会员

目录: 软件及互联网产品