2025-03-31 22:54:57    127    0    0
Shell命令 利用 Shell 命令 HBase 中创建表 HBase 中用 create 命令创建表,具体如下: $ create 'student','Sname','Ssex','Sage','Sdept','course' 命令执行截图如下: 此时,即创建了一个“student”表,属性有:Sname,Ssex,Sage,Sdept,course。因为 HBase 的表中会有一个系统默认的属性作为行键,无需自行创建,默认为 put 命令操作中表名后第一个数据。创建完"student"表后,可通过 describe 命令查看“student
Hive    2022-10-31 11:25:34    24    0    0
安装hive,并配置mysql作为元数据库 hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 一、安装hive 安装hive前需要安装Hadoop,方法可参考Hadoop安装教程 1. 下载并解压hive源程序 本实验以Ubuntu18作为示例,演示hive-1.2.1的安装过程 hive
2024-04-09 15:51:40    22    0    0
入门指南 InfluxDB安装完成之后,我们开始来做一些有意思的事。在这一章里面我们将会用到influx这个命令行工具,这个工具包含在InfluxDB的安装包里,是一个操作数据库的轻量级工具。它直接通过InfluxDB的HTTP接口(如果没有修改,默认是8086)来和InfluxDB通信。 说明:也可以直接发送裸的HTTP请求来操作数据库,例如curl 创建数据库 如果你已经在本地安装运行了InfluxDB,你就可以直接使用influx命令行,执行influx连接到本地的InfluxDB实例上。输出就像下面这样: $ influx -precision
Kafka    2022-12-05 23:06:00    31    0    0
Apache Kafka 概述 在大数据中,使用了大量的数据。 关于数据,我们有两个主要挑战。第一个挑战是如何收集大量的数据,第二个挑战是分析收集的数据。 为了克服这些挑战,您必须需要一个消息系统。 Kafka 专为分布式高吞吐量系统而设计。 Kafka 往往工作得很好,作为一个更传统的消息代理的替代品。 与其他消息传递系统相比,Kafka 具有更好的吞吐量,内置分区,复制和固有的容错能力,这使得它非常适合大规模消息处理应用程序。 什么是消息系统? 消息系统负责将数据从一个应用程序传输到另一个应用程序,因此应用程序可以专注于数据,但不担心如何共享它。 分布式消息传递基于可靠消息队
MongoDB    2024-04-17 09:59:39    30    0    0
MongoDB概念解析 不管我们学习什么数据库都应该学习其中的基础概念,在mongodb中基本的概念是文档、集合、数据库,下面我们挨个介绍。 下表将帮助您更容易理解Mongo中的一些概念: SQL术语/概念 MongoDB术语/概念 解释/说明 database database 数据库 table collection 数据库表/集合 row document 数据记录行/文档 column field 数据字段/域 index index 索引 table joins
2024-04-17 09:59:47    17    0    0
CQL 代表 Cypher 查询语言。 像 Oracle 数据库具有查询语言 SQL,Neo4j 具有 CQL 作为查询语言。 Neo4j CQL - 它是 Neo4j 图形数据库的查询语言。 它是一种声明性模式匹配语言 它遵循 SQL 语法。 它的语法是非常简单且人性化、可读的格式。 如 Oracle SQL - Neo4j CQL 以命令来执行数据库操作。 Neo4j CQL 支持多个子句像在哪里,顺序等,以非常简单的方式编写非常复杂的查询。 NNeo4j CQL 支持一些功能,如字符串,A
2023-04-24 13:04:29    59    0    0
通过 Spark Shell 进行交互分析 Spark shell 提供了简单的方式来学习 API,也提供了交互的方式来分析数据。Spark Shell 支持 Scala 和 Python,本教程选择使用 Scala 来进行介绍。 执行如下命令启动 Spark Shell: nbu@/usr/local/spark$./bin/spark-shell 启动成功后如图所示,会有 “scala >” 的命令提示符。 退出spark如下: scala> :quit 基础操作 Spark 的主要抽象是分布式的元素集合(distribut
Hadoop    2022-12-10 21:16:27    289    0    0
Yarn基本配置 修改mapred-site.xml 由于在配置文件目录cd /usr/local/hadoop/etc/hadoop/下没有,需要将mapred-site.xml.template复制为mapred-site.xml nbu@ecs:~$ cd /usr/local/hadoop/etc/hadoop/nbu@ecs:/usr/local/hadoop/etc/hadoop$ cp mapred-site.xml.template mapred-site.xmlnbu@ecs:/usr/local/hadoop/etc/hadoop$ vim mapred-s
Zookeeper    2022-10-17 19:47:21    47    0    0
Linux 安装 zookeeper 下载地址为: https://zookeeper.apache.org/releases.html。 选择一稳定版本,本教程使用的 release 版本为 3.7.1,下载并安装。点击看到如下界面: 选择下载地址,也可以点击此处下载Zookeeper3.7.1 注意 请将下载后的文件 重名名为:apache-zookeeper-3.7.1-bin.tar.gz 将apache-zookeeper-3.7.1-bin.tar.gz放在/opt/software/ 路径下 Zookeeper 下载安装
openGauss数据库    2022-10-15 14:19:04    19    0    0
1 数据库开发实验 1.1 创建和管理用户、表空间和数据库 1.1.1 创建和管理用户 1.1.1.1 创建用户 通过CREATE USER创建的用户,默认具有LOGIN权限; 通过CREATE USER创建用户的同时系统会在执行该命令的数据库中,为该用户创建一个同名的SCHEMA;其他数据库中,则不自动创建同名的SCHEMA;用户可使用CREATE SCHEMA命令,分别在其他数据库中,为该用户创建同名SCHEMA。 系统管理员在普通用户同名schema下创建的对象,所有者为schema的同名用户(非系统管理员)。 创建用户jim,登录密码为Big