SlideShare una empresa de Scribd logo
Introducción a HBase


            Marcos Ortiz
           mlortiz@uci.cu
          @marcosluis2186
                       1
El auge del NoSQL




                2
Qué es HBase?
Clon de Google BigTable:
http://labs.google.com/papers/bigtable.html

Creada originalmente en Powerset en 2007

SubProyecto de Apache Hadoop


                                              3
Modelo de almacenamiento
      basado en columnas
Es un sistema de almacenamiento orientado a
columnas semiestructurado

Distribuido sobre varios servidores

Tolerante a fallos de servidores

Usa HDFS como sus sistema de almacenamiento
                                              4
Tablas y regiones
Las filas son almacenadas en un orden det tipo byte-
lexicográfico

Las tablas son dinámicamente divididas en ¨regiones¨

Cada región contiene los valores desde [startKey,
endKey]

Las regiones son hosteadas en un RegionServer          5
Tablas y regiones




               6
Almacenamiento
Piensen en un sistema de etiquetas. Los valores pueden
ser de cualquier dimensión, no hay nombres
predefinidos o tamaños




                                                   7
Familia de columnas
Las tablas estás compuestas por 1 o más Columns
Families (CF), que no son más que unidades para la
optimización del rendimiento




                                               8
9
Almacenamiento
create 'crash_report_signatures', {NAME => 'counters',
COMPRESSION => 'LZO', VERSIONS => '1', TTL =>
'2147483647', BLOCKSIZE => '65536', IN_MEMORY => 'false',
BLOCKCACHE => 'true'}, {NAME => 'json', COMPRESSION =>
'LZO', VERSIONS => '3', TTL => '2147483647', BLOCKSIZE =>
'65536', IN_MEMORY => 'false', BLOCKCACHE => 'true'}


                                                       10
Quién usa HBase?




               11
Quién usa HBase?


110 TB en HDFS
~ 40 TB en HBase
2300 crash p/min
> 120 servidores
físicos
                                  12
Quién usa HBase?
+30 Billones de
eventos
de + 10 Millones
de usuarios
+ 10 años de datos
(clínicos, financieros,
operacionales)

                                         13
Quién usa HBase?
OpenTSDB: sistema desarrollado para el
monitoreo de todos los servicios y
servidores en SU

~ 6 TB en HBase para las métricas

>100 TB en otro cluster de HBase para el
sistema de recomendación

Emplean a varios de los HBase commiters
                                      14
Quién usa HBase?




               15
Desarrollo futuro de HBase
* Apache Hadoop 2.0: HA NameNode, no más SPOF para
HBase
* Failover automático para HA Namenodes (HDFS-3042)
* Pistas para el copiado de bloques de forma específica
(HBASE-4755)
* Hard links para HDFS (HDFS-3370): Permitirá el clonado y
snapshots de tablas eficientemente

                                                             16
Contactos
Todd Lipcon (Cloudera)
Lars George (Cloudera)
Michael Stack (StumbleUpon)
Jean-Daniel Cryans (StumbleUpon)
Nicolas Spiegelberg (Facebook)
Jonathan Grey (Former VP of Data Engineering Team at
Facebook, Founder at Continuuity)
Andrew Purtell (Trend Micro)
Lars Hofhansl (Salesforce.com)
Doug Meil (CTO at Explorys)                            17
Recursos




      18
Recursos
HBase at Explorys: How Big Data saved lives:
http://www.slideshare.net/cloudera/from-big-data-to-lives-saved-hbase-in-heathca

HBase and HDFS: Past, Present and Future por Todd Lipcon:
http://www.slideshare.net/cloudera/1-todd-lipcon-past-present-futurepdf

Powered by HBase's list:
http://wiki.apache.org/hadoop/Hbase/PoweredBy



                                                                          19
Preguntas
Sugerencias
Comentarios
    ???
              20
Publicidad

Más contenido relacionado

La actualidad más candente (20)

ADO
ADOADO
ADO
Jairo Quiroz Cabanillas
 
Dataset y datatable
Dataset y datatableDataset y datatable
Dataset y datatable
frank yordi tejada sanchez
 
Metodologías Para AnáLisis Y DiseñO Orientado A Objetos
Metodologías Para AnáLisis Y DiseñO Orientado A ObjetosMetodologías Para AnáLisis Y DiseñO Orientado A Objetos
Metodologías Para AnáLisis Y DiseñO Orientado A Objetos
hector_h30
 
Diseño & Procesamiento de transacciones
Diseño & Procesamiento de transaccionesDiseño & Procesamiento de transacciones
Diseño & Procesamiento de transacciones
Blanca Parra
 
BD. control de concurrencia
BD. control de concurrenciaBD. control de concurrencia
BD. control de concurrencia
liras loca
 
mongoDB - Arquitectura y Componentes
mongoDB - Arquitectura y ComponentesmongoDB - Arquitectura y Componentes
mongoDB - Arquitectura y Componentes
omenar
 
Procedimientos Almacenados SQL SEVER.pptx
Procedimientos Almacenados SQL SEVER.pptxProcedimientos Almacenados SQL SEVER.pptx
Procedimientos Almacenados SQL SEVER.pptx
CESARHERNANPATRICIOP1
 
Ejemplo LOGIN conectado a una base de datos
Ejemplo LOGIN conectado a una base de datosEjemplo LOGIN conectado a una base de datos
Ejemplo LOGIN conectado a una base de datos
Vane Borjas
 
PROTOCOLO DE BLOQUEO EN 2 FASES
PROTOCOLO DE BLOQUEO EN 2 FASESPROTOCOLO DE BLOQUEO EN 2 FASES
PROTOCOLO DE BLOQUEO EN 2 FASES
GEOVANIFERNANDOMENDO
 
Unidad III procedimientos
Unidad III procedimientosUnidad III procedimientos
Unidad III procedimientos
aaronastorga4
 
¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...
¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...
¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...
Frans Michel Barrenechea Arias
 
Transaccion
TransaccionTransaccion
Transaccion
Alberto Torres
 
Bases de Datos No Relacionales (NoSQL): Cassandra, CouchDB, MongoDB y Neo4j
Bases de Datos No Relacionales (NoSQL): Cassandra, CouchDB, MongoDB y Neo4jBases de Datos No Relacionales (NoSQL): Cassandra, CouchDB, MongoDB y Neo4j
Bases de Datos No Relacionales (NoSQL): Cassandra, CouchDB, MongoDB y Neo4j
Diego López-de-Ipiña González-de-Artaza
 
TRIGGERS O DISPARADORES
TRIGGERS O DISPARADORESTRIGGERS O DISPARADORES
TRIGGERS O DISPARADORES
Lisbeth Ocaña Bueno
 
Transacciones y errores en mysql
Transacciones y errores en mysqlTransacciones y errores en mysql
Transacciones y errores en mysql
Alberto Rodriguez Vargas
 
Introduccion Analisis Algoritmos
Introduccion Analisis AlgoritmosIntroduccion Analisis Algoritmos
Introduccion Analisis Algoritmos
UV ADMINISTRACION (SISTEMAS)
 
Unidad 4 a HERENCIA, CLASES ABSTRACTAS, INTERFACES Y POLIMORFISMO . UML
Unidad 4 a HERENCIA, CLASES ABSTRACTAS, INTERFACES Y POLIMORFISMO . UMLUnidad 4 a HERENCIA, CLASES ABSTRACTAS, INTERFACES Y POLIMORFISMO . UML
Unidad 4 a HERENCIA, CLASES ABSTRACTAS, INTERFACES Y POLIMORFISMO . UML
Cindy Adriana Bohórquez Santana
 
RAID
RAIDRAID
RAID
luisfranespinoza
 
Bd nosql clave valor
Bd nosql clave valorBd nosql clave valor
Bd nosql clave valor
Escuela de Computación UCV
 
Ejercicios sql
Ejercicios sqlEjercicios sql
Ejercicios sql
Victor Morales
 
Metodologías Para AnáLisis Y DiseñO Orientado A Objetos
Metodologías Para AnáLisis Y DiseñO Orientado A ObjetosMetodologías Para AnáLisis Y DiseñO Orientado A Objetos
Metodologías Para AnáLisis Y DiseñO Orientado A Objetos
hector_h30
 
Diseño & Procesamiento de transacciones
Diseño & Procesamiento de transaccionesDiseño & Procesamiento de transacciones
Diseño & Procesamiento de transacciones
Blanca Parra
 
BD. control de concurrencia
BD. control de concurrenciaBD. control de concurrencia
BD. control de concurrencia
liras loca
 
mongoDB - Arquitectura y Componentes
mongoDB - Arquitectura y ComponentesmongoDB - Arquitectura y Componentes
mongoDB - Arquitectura y Componentes
omenar
 
Procedimientos Almacenados SQL SEVER.pptx
Procedimientos Almacenados SQL SEVER.pptxProcedimientos Almacenados SQL SEVER.pptx
Procedimientos Almacenados SQL SEVER.pptx
CESARHERNANPATRICIOP1
 
Ejemplo LOGIN conectado a una base de datos
Ejemplo LOGIN conectado a una base de datosEjemplo LOGIN conectado a una base de datos
Ejemplo LOGIN conectado a una base de datos
Vane Borjas
 
Unidad III procedimientos
Unidad III procedimientosUnidad III procedimientos
Unidad III procedimientos
aaronastorga4
 
¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...
¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...
¿Qué SGBD (Sistema de Gestor de BD) y tecnologías utilizan: Facebook, Twitter...
Frans Michel Barrenechea Arias
 
Unidad 4 a HERENCIA, CLASES ABSTRACTAS, INTERFACES Y POLIMORFISMO . UML
Unidad 4 a HERENCIA, CLASES ABSTRACTAS, INTERFACES Y POLIMORFISMO . UMLUnidad 4 a HERENCIA, CLASES ABSTRACTAS, INTERFACES Y POLIMORFISMO . UML
Unidad 4 a HERENCIA, CLASES ABSTRACTAS, INTERFACES Y POLIMORFISMO . UML
Cindy Adriana Bohórquez Santana
 

Destacado (20)

Apache hadoop hbase
Apache hadoop hbaseApache hadoop hbase
Apache hadoop hbase
sheetal sharma
 
Hbase: Introduction to column oriented databases
Hbase: Introduction to column oriented databasesHbase: Introduction to column oriented databases
Hbase: Introduction to column oriented databases
Luis Cipriani
 
The Evolution of a Relational Database Layer over HBase
The Evolution of a Relational Database Layer over HBaseThe Evolution of a Relational Database Layer over HBase
The Evolution of a Relational Database Layer over HBase
DataWorks Summit
 
HBaseCon 2012 | HBase Schema Design - Ian Varley, Salesforce
HBaseCon 2012 | HBase Schema Design - Ian Varley, SalesforceHBaseCon 2012 | HBase Schema Design - Ian Varley, Salesforce
HBaseCon 2012 | HBase Schema Design - Ian Varley, Salesforce
Cloudera, Inc.
 
HBaseCon 2013: Multi-tenant Apache HBase at Yahoo!
HBaseCon 2013: Multi-tenant Apache HBase at Yahoo! HBaseCon 2013: Multi-tenant Apache HBase at Yahoo!
HBaseCon 2013: Multi-tenant Apache HBase at Yahoo!
Sumeet Singh
 
Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Hadoop, Cloud y Spring
Hadoop, Cloud y Spring
Miguel Pastor
 
Spark-on-Yarn: The Road Ahead-(Marcelo Vanzin, Cloudera)
Spark-on-Yarn: The Road Ahead-(Marcelo Vanzin, Cloudera)Spark-on-Yarn: The Road Ahead-(Marcelo Vanzin, Cloudera)
Spark-on-Yarn: The Road Ahead-(Marcelo Vanzin, Cloudera)
Spark Summit
 
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
Socialmetrix
 
Row or Columnar Database
Row or Columnar DatabaseRow or Columnar Database
Row or Columnar Database
Biju Nair
 
SAS for Claims Fraud
SAS for Claims FraudSAS for Claims Fraud
SAS for Claims Fraud
stuartdrose
 
Big Data en el entorno Bancario
Big Data en el entorno BancarioBig Data en el entorno Bancario
Big Data en el entorno Bancario
Martín Cabrera
 
Hadoop World 2011: Advanced HBase Schema Design
Hadoop World 2011: Advanced HBase Schema DesignHadoop World 2011: Advanced HBase Schema Design
Hadoop World 2011: Advanced HBase Schema Design
Cloudera, Inc.
 
Proyectos everis
Proyectos everisProyectos everis
Proyectos everis
Esther Lanza
 
SAS and Cloudera – Analytics at Scale
SAS and Cloudera – Analytics at ScaleSAS and Cloudera – Analytics at Scale
SAS and Cloudera – Analytics at Scale
Cloudera, Inc.
 
Apache HBase 1.0 Release
Apache HBase 1.0 ReleaseApache HBase 1.0 Release
Apache HBase 1.0 Release
Nick Dimiduk
 
Near-realtime analytics with Kafka and HBase
Near-realtime analytics with Kafka and HBaseNear-realtime analytics with Kafka and HBase
Near-realtime analytics with Kafka and HBase
dave_revell
 
Meet Latin American Game Developers
Meet Latin American Game DevelopersMeet Latin American Game Developers
Meet Latin American Game Developers
Alvaro Gonzalez
 
SAS Modernization architectures - Big Data Analytics
SAS Modernization architectures - Big Data AnalyticsSAS Modernization architectures - Big Data Analytics
SAS Modernization architectures - Big Data Analytics
Deepak Ramanathan
 
Past present and future of Recommender Systems: an Industry Perspective
Past present and future of Recommender Systems: an Industry PerspectivePast present and future of Recommender Systems: an Industry Perspective
Past present and future of Recommender Systems: an Industry Perspective
Xavier Amatriain
 
Almacenamiento en la Nube y Cloud Computing
Almacenamiento en la Nube y Cloud ComputingAlmacenamiento en la Nube y Cloud Computing
Almacenamiento en la Nube y Cloud Computing
Alfredo Vela Zancada
 
Hbase: Introduction to column oriented databases
Hbase: Introduction to column oriented databasesHbase: Introduction to column oriented databases
Hbase: Introduction to column oriented databases
Luis Cipriani
 
The Evolution of a Relational Database Layer over HBase
The Evolution of a Relational Database Layer over HBaseThe Evolution of a Relational Database Layer over HBase
The Evolution of a Relational Database Layer over HBase
DataWorks Summit
 
HBaseCon 2012 | HBase Schema Design - Ian Varley, Salesforce
HBaseCon 2012 | HBase Schema Design - Ian Varley, SalesforceHBaseCon 2012 | HBase Schema Design - Ian Varley, Salesforce
HBaseCon 2012 | HBase Schema Design - Ian Varley, Salesforce
Cloudera, Inc.
 
HBaseCon 2013: Multi-tenant Apache HBase at Yahoo!
HBaseCon 2013: Multi-tenant Apache HBase at Yahoo! HBaseCon 2013: Multi-tenant Apache HBase at Yahoo!
HBaseCon 2013: Multi-tenant Apache HBase at Yahoo!
Sumeet Singh
 
Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Hadoop, Cloud y Spring
Hadoop, Cloud y Spring
Miguel Pastor
 
Spark-on-Yarn: The Road Ahead-(Marcelo Vanzin, Cloudera)
Spark-on-Yarn: The Road Ahead-(Marcelo Vanzin, Cloudera)Spark-on-Yarn: The Road Ahead-(Marcelo Vanzin, Cloudera)
Spark-on-Yarn: The Road Ahead-(Marcelo Vanzin, Cloudera)
Spark Summit
 
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
Socialmetrix
 
Row or Columnar Database
Row or Columnar DatabaseRow or Columnar Database
Row or Columnar Database
Biju Nair
 
SAS for Claims Fraud
SAS for Claims FraudSAS for Claims Fraud
SAS for Claims Fraud
stuartdrose
 
Big Data en el entorno Bancario
Big Data en el entorno BancarioBig Data en el entorno Bancario
Big Data en el entorno Bancario
Martín Cabrera
 
Hadoop World 2011: Advanced HBase Schema Design
Hadoop World 2011: Advanced HBase Schema DesignHadoop World 2011: Advanced HBase Schema Design
Hadoop World 2011: Advanced HBase Schema Design
Cloudera, Inc.
 
SAS and Cloudera – Analytics at Scale
SAS and Cloudera – Analytics at ScaleSAS and Cloudera – Analytics at Scale
SAS and Cloudera – Analytics at Scale
Cloudera, Inc.
 
Apache HBase 1.0 Release
Apache HBase 1.0 ReleaseApache HBase 1.0 Release
Apache HBase 1.0 Release
Nick Dimiduk
 
Near-realtime analytics with Kafka and HBase
Near-realtime analytics with Kafka and HBaseNear-realtime analytics with Kafka and HBase
Near-realtime analytics with Kafka and HBase
dave_revell
 
Meet Latin American Game Developers
Meet Latin American Game DevelopersMeet Latin American Game Developers
Meet Latin American Game Developers
Alvaro Gonzalez
 
SAS Modernization architectures - Big Data Analytics
SAS Modernization architectures - Big Data AnalyticsSAS Modernization architectures - Big Data Analytics
SAS Modernization architectures - Big Data Analytics
Deepak Ramanathan
 
Past present and future of Recommender Systems: an Industry Perspective
Past present and future of Recommender Systems: an Industry PerspectivePast present and future of Recommender Systems: an Industry Perspective
Past present and future of Recommender Systems: an Industry Perspective
Xavier Amatriain
 
Almacenamiento en la Nube y Cloud Computing
Almacenamiento en la Nube y Cloud ComputingAlmacenamiento en la Nube y Cloud Computing
Almacenamiento en la Nube y Cloud Computing
Alfredo Vela Zancada
 
Publicidad

Similar a Introducción a Apache HBase (20)

Webinar de Introducción a Hive y Zeppelin
Webinar de Introducción a Hive y ZeppelinWebinar de Introducción a Hive y Zeppelin
Webinar de Introducción a Hive y Zeppelin
Federico Leven
 
Polybase
PolybasePolybase
Polybase
SolidQ
 
Base de datos no sql
Base de datos no sqlBase de datos no sql
Base de datos no sql
hnacostan
 
Motores de bases de datos open source
Motores de bases de datos open sourceMotores de bases de datos open source
Motores de bases de datos open source
eduardojose55
 
HDFS.pdf
HDFS.pdfHDFS.pdf
HDFS.pdf
MaraBelnVillanuevaMo
 
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Joseph Lopez
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Urko Zurutuza
 
3. Hadoop
3.  Hadoop3.  Hadoop
3. Hadoop
Cristian González García
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Joseph Lopez
 
Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL Server
Eduardo Castro
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIs
Big Data Spain
 
An evening with... Apache hadoop Meetup
An evening with...  Apache hadoop MeetupAn evening with...  Apache hadoop Meetup
An evening with... Apache hadoop Meetup
Arkhotech
 
Bases de datos
Bases de datos Bases de datos
Bases de datos
Millercris Alamo
 
Big data y las apis (big data spain)
Big data y las apis (big data spain)Big data y las apis (big data spain)
Big data y las apis (big data spain)
CloudAppi
 
Clase Hadoop
Clase HadoopClase Hadoop
Clase Hadoop
JorgeAntonioCabreraG2
 
Bases de datos
Bases de datos Bases de datos
Bases de datos
saul alva
 
Codigoparacrearlabasededatos
Codigoparacrearlabasededatos Codigoparacrearlabasededatos
Codigoparacrearlabasededatos
Ashley Stronghold Witwicky
 
Codigo para crear la base de datos
Codigo para crear la base de datosCodigo para crear la base de datos
Codigo para crear la base de datos
Alvaro Cardona
 
guia-2.pdf
guia-2.pdfguia-2.pdf
guia-2.pdf
AntonioHurtado37
 
No sql la nueva era
No sql la nueva eraNo sql la nueva era
No sql la nueva era
Juan Navas
 
Webinar de Introducción a Hive y Zeppelin
Webinar de Introducción a Hive y ZeppelinWebinar de Introducción a Hive y Zeppelin
Webinar de Introducción a Hive y Zeppelin
Federico Leven
 
Polybase
PolybasePolybase
Polybase
SolidQ
 
Base de datos no sql
Base de datos no sqlBase de datos no sql
Base de datos no sql
hnacostan
 
Motores de bases de datos open source
Motores de bases de datos open sourceMotores de bases de datos open source
Motores de bases de datos open source
eduardojose55
 
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Joseph Lopez
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Urko Zurutuza
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Joseph Lopez
 
Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL Server
Eduardo Castro
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIs
Big Data Spain
 
An evening with... Apache hadoop Meetup
An evening with...  Apache hadoop MeetupAn evening with...  Apache hadoop Meetup
An evening with... Apache hadoop Meetup
Arkhotech
 
Big data y las apis (big data spain)
Big data y las apis (big data spain)Big data y las apis (big data spain)
Big data y las apis (big data spain)
CloudAppi
 
Bases de datos
Bases de datos Bases de datos
Bases de datos
saul alva
 
Codigo para crear la base de datos
Codigo para crear la base de datosCodigo para crear la base de datos
Codigo para crear la base de datos
Alvaro Cardona
 
No sql la nueva era
No sql la nueva eraNo sql la nueva era
No sql la nueva era
Juan Navas
 
Publicidad

Más de Marcos Ortiz Valmaseda (9)

SEC: Actualización de la definición de "Inversor Acreditado" en el 2019
SEC: Actualización de la definición de "Inversor Acreditado" en el 2019SEC: Actualización de la definición de "Inversor Acreditado" en el 2019
SEC: Actualización de la definición de "Inversor Acreditado" en el 2019
Marcos Ortiz Valmaseda
 
A Partnership with Adyen is Equal to Exponential Growth: 17 Payments Experts ...
A Partnership with Adyen is Equal to Exponential Growth: 17 Payments Experts ...A Partnership with Adyen is Equal to Exponential Growth: 17 Payments Experts ...
A Partnership with Adyen is Equal to Exponential Growth: 17 Payments Experts ...
Marcos Ortiz Valmaseda
 
7 Ideas to Revamp Product Marketing at Duo Security
7 Ideas to Revamp Product Marketing at Duo Security7 Ideas to Revamp Product Marketing at Duo Security
7 Ideas to Revamp Product Marketing at Duo Security
Marcos Ortiz Valmaseda
 
200 Global Facts about the State of Small Businesses in 2015
200 Global Facts about the State of Small Businesses in 2015200 Global Facts about the State of Small Businesses in 2015
200 Global Facts about the State of Small Businesses in 2015
Marcos Ortiz Valmaseda
 
50+ facts about State of CyberSecurity in 2015
50+ facts about State of CyberSecurity in 201550+ facts about State of CyberSecurity in 2015
50+ facts about State of CyberSecurity in 2015
Marcos Ortiz Valmaseda
 
The future of marketing
The future of marketingThe future of marketing
The future of marketing
Marcos Ortiz Valmaseda
 
Research group in databases technologies
Research group in databases technologiesResearch group in databases technologies
Research group in databases technologies
Marcos Ortiz Valmaseda
 
Postgre Sql Para Las Empresas Cubanas
Postgre Sql Para Las Empresas CubanasPostgre Sql Para Las Empresas Cubanas
Postgre Sql Para Las Empresas Cubanas
Marcos Ortiz Valmaseda
 
Estado del Desarrollo de PostgreSQL-9.0
Estado del Desarrollo de PostgreSQL-9.0Estado del Desarrollo de PostgreSQL-9.0
Estado del Desarrollo de PostgreSQL-9.0
Marcos Ortiz Valmaseda
 
SEC: Actualización de la definición de "Inversor Acreditado" en el 2019
SEC: Actualización de la definición de "Inversor Acreditado" en el 2019SEC: Actualización de la definición de "Inversor Acreditado" en el 2019
SEC: Actualización de la definición de "Inversor Acreditado" en el 2019
Marcos Ortiz Valmaseda
 
A Partnership with Adyen is Equal to Exponential Growth: 17 Payments Experts ...
A Partnership with Adyen is Equal to Exponential Growth: 17 Payments Experts ...A Partnership with Adyen is Equal to Exponential Growth: 17 Payments Experts ...
A Partnership with Adyen is Equal to Exponential Growth: 17 Payments Experts ...
Marcos Ortiz Valmaseda
 
7 Ideas to Revamp Product Marketing at Duo Security
7 Ideas to Revamp Product Marketing at Duo Security7 Ideas to Revamp Product Marketing at Duo Security
7 Ideas to Revamp Product Marketing at Duo Security
Marcos Ortiz Valmaseda
 
200 Global Facts about the State of Small Businesses in 2015
200 Global Facts about the State of Small Businesses in 2015200 Global Facts about the State of Small Businesses in 2015
200 Global Facts about the State of Small Businesses in 2015
Marcos Ortiz Valmaseda
 
50+ facts about State of CyberSecurity in 2015
50+ facts about State of CyberSecurity in 201550+ facts about State of CyberSecurity in 2015
50+ facts about State of CyberSecurity in 2015
Marcos Ortiz Valmaseda
 
Research group in databases technologies
Research group in databases technologiesResearch group in databases technologies
Research group in databases technologies
Marcos Ortiz Valmaseda
 
Estado del Desarrollo de PostgreSQL-9.0
Estado del Desarrollo de PostgreSQL-9.0Estado del Desarrollo de PostgreSQL-9.0
Estado del Desarrollo de PostgreSQL-9.0
Marcos Ortiz Valmaseda
 

Último (20)

Presentación Introducción a la Química Orgánica Ilustrativo verde.pdf
Presentación Introducción a la Química Orgánica Ilustrativo verde.pdfPresentación Introducción a la Química Orgánica Ilustrativo verde.pdf
Presentación Introducción a la Química Orgánica Ilustrativo verde.pdf
LisbethJacquelineBou
 
Redes industriales yde instrumentacion.pptx
Redes industriales yde instrumentacion.pptxRedes industriales yde instrumentacion.pptx
Redes industriales yde instrumentacion.pptx
TeresitaXalapa
 
Diseño de una red de comunicaciones en una vivienda.pptx
Diseño de una red de comunicaciones en una vivienda.pptxDiseño de una red de comunicaciones en una vivienda.pptx
Diseño de una red de comunicaciones en una vivienda.pptx
dvdgrcbd
 
Tema 04Cuidados de Enfermería al neonato con trastornos metabólicos (1).pdf
Tema 04Cuidados de Enfermería al neonato con trastornos metabólicos  (1).pdfTema 04Cuidados de Enfermería al neonato con trastornos metabólicos  (1).pdf
Tema 04Cuidados de Enfermería al neonato con trastornos metabólicos (1).pdf
MARIAMALENATORRESDIA
 
EDICIÓN DE VIDEO. CLASE DE TICS II. UNIREU
EDICIÓN DE VIDEO. CLASE DE TICS II. UNIREUEDICIÓN DE VIDEO. CLASE DE TICS II. UNIREU
EDICIÓN DE VIDEO. CLASE DE TICS II. UNIREU
AndrsCastro58
 
Plataforma Virtual E-Learning MOODLE.pdf
Plataforma Virtual E-Learning MOODLE.pdfPlataforma Virtual E-Learning MOODLE.pdf
Plataforma Virtual E-Learning MOODLE.pdf
GINGER YULISA ZAMBRANO NOBOA
 
Llevando la productividad al siguiente nivel: Agentes de Copilot para Sitios ...
Llevando la productividad al siguiente nivel: Agentes de Copilot para Sitios ...Llevando la productividad al siguiente nivel: Agentes de Copilot para Sitios ...
Llevando la productividad al siguiente nivel: Agentes de Copilot para Sitios ...
Juan Carlos Gonzalez
 
Tecnología, ciencias y técnicas ¿Cuál es su relación?
Tecnología, ciencias y técnicas ¿Cuál es su relación?Tecnología, ciencias y técnicas ¿Cuál es su relación?
Tecnología, ciencias y técnicas ¿Cuál es su relación?
pamelayaquelingomez
 
ciberseguridad habilidades Digitales.pdf
ciberseguridad habilidades Digitales.pdfciberseguridad habilidades Digitales.pdf
ciberseguridad habilidades Digitales.pdf
dayanacampos31
 
StacksTecnológicosInformaciónPresentación.pdf
StacksTecnológicosInformaciónPresentación.pdfStacksTecnológicosInformaciónPresentación.pdf
StacksTecnológicosInformaciónPresentación.pdf
SamuelMancebo2
 
Windows 11 25H2 PPTX file: PDF y PPTX.pptx
Windows 11 25H2 PPTX file: PDF y PPTX.pptxWindows 11 25H2 PPTX file: PDF y PPTX.pptx
Windows 11 25H2 PPTX file: PDF y PPTX.pptx
carloscubillos36
 
MÓDULO I. (conceptos generales de higiene ocupacional)
MÓDULO I. (conceptos generales de higiene ocupacional)MÓDULO I. (conceptos generales de higiene ocupacional)
MÓDULO I. (conceptos generales de higiene ocupacional)
AimeeCoronel2
 
Presentación.pdf Cristopher Maruri Morla
Presentación.pdf Cristopher Maruri MorlaPresentación.pdf Cristopher Maruri Morla
Presentación.pdf Cristopher Maruri Morla
alejandromaruri1999
 
Habilidades digitales Taller Ciberseguridad
Habilidades digitales Taller CiberseguridadHabilidades digitales Taller Ciberseguridad
Habilidades digitales Taller Ciberseguridad
juandavidmahechafier
 
Trailblazer Community Veracruz - Salesforce Saturday sesión 26 de abril
Trailblazer Community Veracruz - Salesforce Saturday sesión 26 de abrilTrailblazer Community Veracruz - Salesforce Saturday sesión 26 de abril
Trailblazer Community Veracruz - Salesforce Saturday sesión 26 de abril
Rodrigo Rosas Zamudio
 
listado lideres funcionales para la formacion del coimite de riesgos.pptx
listado lideres funcionales para la formacion del coimite de riesgos.pptxlistado lideres funcionales para la formacion del coimite de riesgos.pptx
listado lideres funcionales para la formacion del coimite de riesgos.pptx
hirsoporteti
 
SISTEMAS OPERATIVOS, LA MAGIA DE LA TECNOLOGIA
SISTEMAS OPERATIVOS, LA MAGIA DE LA TECNOLOGIASISTEMAS OPERATIVOS, LA MAGIA DE LA TECNOLOGIA
SISTEMAS OPERATIVOS, LA MAGIA DE LA TECNOLOGIA
IVAN CAMPUZANO
 
Registro ABA instrutivo para su instalacion
Registro ABA instrutivo para su instalacionRegistro ABA instrutivo para su instalacion
Registro ABA instrutivo para su instalacion
bomeza
 
Blackboard_universidad_de_guayaquil_informatica.pdf
Blackboard_universidad_de_guayaquil_informatica.pdfBlackboard_universidad_de_guayaquil_informatica.pdf
Blackboard_universidad_de_guayaquil_informatica.pdf
guillosilva11
 
HABILIDADES DIGITALES - CIBERSEGURIDAD.pdf
HABILIDADES DIGITALES - CIBERSEGURIDAD.pdfHABILIDADES DIGITALES - CIBERSEGURIDAD.pdf
HABILIDADES DIGITALES - CIBERSEGURIDAD.pdf
jairocaviedes1
 
Presentación Introducción a la Química Orgánica Ilustrativo verde.pdf
Presentación Introducción a la Química Orgánica Ilustrativo verde.pdfPresentación Introducción a la Química Orgánica Ilustrativo verde.pdf
Presentación Introducción a la Química Orgánica Ilustrativo verde.pdf
LisbethJacquelineBou
 
Redes industriales yde instrumentacion.pptx
Redes industriales yde instrumentacion.pptxRedes industriales yde instrumentacion.pptx
Redes industriales yde instrumentacion.pptx
TeresitaXalapa
 
Diseño de una red de comunicaciones en una vivienda.pptx
Diseño de una red de comunicaciones en una vivienda.pptxDiseño de una red de comunicaciones en una vivienda.pptx
Diseño de una red de comunicaciones en una vivienda.pptx
dvdgrcbd
 
Tema 04Cuidados de Enfermería al neonato con trastornos metabólicos (1).pdf
Tema 04Cuidados de Enfermería al neonato con trastornos metabólicos  (1).pdfTema 04Cuidados de Enfermería al neonato con trastornos metabólicos  (1).pdf
Tema 04Cuidados de Enfermería al neonato con trastornos metabólicos (1).pdf
MARIAMALENATORRESDIA
 
EDICIÓN DE VIDEO. CLASE DE TICS II. UNIREU
EDICIÓN DE VIDEO. CLASE DE TICS II. UNIREUEDICIÓN DE VIDEO. CLASE DE TICS II. UNIREU
EDICIÓN DE VIDEO. CLASE DE TICS II. UNIREU
AndrsCastro58
 
Llevando la productividad al siguiente nivel: Agentes de Copilot para Sitios ...
Llevando la productividad al siguiente nivel: Agentes de Copilot para Sitios ...Llevando la productividad al siguiente nivel: Agentes de Copilot para Sitios ...
Llevando la productividad al siguiente nivel: Agentes de Copilot para Sitios ...
Juan Carlos Gonzalez
 
Tecnología, ciencias y técnicas ¿Cuál es su relación?
Tecnología, ciencias y técnicas ¿Cuál es su relación?Tecnología, ciencias y técnicas ¿Cuál es su relación?
Tecnología, ciencias y técnicas ¿Cuál es su relación?
pamelayaquelingomez
 
ciberseguridad habilidades Digitales.pdf
ciberseguridad habilidades Digitales.pdfciberseguridad habilidades Digitales.pdf
ciberseguridad habilidades Digitales.pdf
dayanacampos31
 
StacksTecnológicosInformaciónPresentación.pdf
StacksTecnológicosInformaciónPresentación.pdfStacksTecnológicosInformaciónPresentación.pdf
StacksTecnológicosInformaciónPresentación.pdf
SamuelMancebo2
 
Windows 11 25H2 PPTX file: PDF y PPTX.pptx
Windows 11 25H2 PPTX file: PDF y PPTX.pptxWindows 11 25H2 PPTX file: PDF y PPTX.pptx
Windows 11 25H2 PPTX file: PDF y PPTX.pptx
carloscubillos36
 
MÓDULO I. (conceptos generales de higiene ocupacional)
MÓDULO I. (conceptos generales de higiene ocupacional)MÓDULO I. (conceptos generales de higiene ocupacional)
MÓDULO I. (conceptos generales de higiene ocupacional)
AimeeCoronel2
 
Presentación.pdf Cristopher Maruri Morla
Presentación.pdf Cristopher Maruri MorlaPresentación.pdf Cristopher Maruri Morla
Presentación.pdf Cristopher Maruri Morla
alejandromaruri1999
 
Habilidades digitales Taller Ciberseguridad
Habilidades digitales Taller CiberseguridadHabilidades digitales Taller Ciberseguridad
Habilidades digitales Taller Ciberseguridad
juandavidmahechafier
 
Trailblazer Community Veracruz - Salesforce Saturday sesión 26 de abril
Trailblazer Community Veracruz - Salesforce Saturday sesión 26 de abrilTrailblazer Community Veracruz - Salesforce Saturday sesión 26 de abril
Trailblazer Community Veracruz - Salesforce Saturday sesión 26 de abril
Rodrigo Rosas Zamudio
 
listado lideres funcionales para la formacion del coimite de riesgos.pptx
listado lideres funcionales para la formacion del coimite de riesgos.pptxlistado lideres funcionales para la formacion del coimite de riesgos.pptx
listado lideres funcionales para la formacion del coimite de riesgos.pptx
hirsoporteti
 
SISTEMAS OPERATIVOS, LA MAGIA DE LA TECNOLOGIA
SISTEMAS OPERATIVOS, LA MAGIA DE LA TECNOLOGIASISTEMAS OPERATIVOS, LA MAGIA DE LA TECNOLOGIA
SISTEMAS OPERATIVOS, LA MAGIA DE LA TECNOLOGIA
IVAN CAMPUZANO
 
Registro ABA instrutivo para su instalacion
Registro ABA instrutivo para su instalacionRegistro ABA instrutivo para su instalacion
Registro ABA instrutivo para su instalacion
bomeza
 
Blackboard_universidad_de_guayaquil_informatica.pdf
Blackboard_universidad_de_guayaquil_informatica.pdfBlackboard_universidad_de_guayaquil_informatica.pdf
Blackboard_universidad_de_guayaquil_informatica.pdf
guillosilva11
 
HABILIDADES DIGITALES - CIBERSEGURIDAD.pdf
HABILIDADES DIGITALES - CIBERSEGURIDAD.pdfHABILIDADES DIGITALES - CIBERSEGURIDAD.pdf
HABILIDADES DIGITALES - CIBERSEGURIDAD.pdf
jairocaviedes1
 

Introducción a Apache HBase

  • 1. Introducción a HBase Marcos Ortiz [email protected] @marcosluis2186 1
  • 2. El auge del NoSQL 2
  • 3. Qué es HBase? Clon de Google BigTable: http://labs.google.com/papers/bigtable.html Creada originalmente en Powerset en 2007 SubProyecto de Apache Hadoop 3
  • 4. Modelo de almacenamiento basado en columnas Es un sistema de almacenamiento orientado a columnas semiestructurado Distribuido sobre varios servidores Tolerante a fallos de servidores Usa HDFS como sus sistema de almacenamiento 4
  • 5. Tablas y regiones Las filas son almacenadas en un orden det tipo byte- lexicográfico Las tablas son dinámicamente divididas en ¨regiones¨ Cada región contiene los valores desde [startKey, endKey] Las regiones son hosteadas en un RegionServer 5
  • 7. Almacenamiento Piensen en un sistema de etiquetas. Los valores pueden ser de cualquier dimensión, no hay nombres predefinidos o tamaños 7
  • 8. Familia de columnas Las tablas estás compuestas por 1 o más Columns Families (CF), que no son más que unidades para la optimización del rendimiento 8
  • 9. 9
  • 10. Almacenamiento create 'crash_report_signatures', {NAME => 'counters', COMPRESSION => 'LZO', VERSIONS => '1', TTL => '2147483647', BLOCKSIZE => '65536', IN_MEMORY => 'false', BLOCKCACHE => 'true'}, {NAME => 'json', COMPRESSION => 'LZO', VERSIONS => '3', TTL => '2147483647', BLOCKSIZE => '65536', IN_MEMORY => 'false', BLOCKCACHE => 'true'} 10
  • 12. Quién usa HBase? 110 TB en HDFS ~ 40 TB en HBase 2300 crash p/min > 120 servidores físicos 12
  • 13. Quién usa HBase? +30 Billones de eventos de + 10 Millones de usuarios + 10 años de datos (clínicos, financieros, operacionales) 13
  • 14. Quién usa HBase? OpenTSDB: sistema desarrollado para el monitoreo de todos los servicios y servidores en SU ~ 6 TB en HBase para las métricas >100 TB en otro cluster de HBase para el sistema de recomendación Emplean a varios de los HBase commiters 14
  • 16. Desarrollo futuro de HBase * Apache Hadoop 2.0: HA NameNode, no más SPOF para HBase * Failover automático para HA Namenodes (HDFS-3042) * Pistas para el copiado de bloques de forma específica (HBASE-4755) * Hard links para HDFS (HDFS-3370): Permitirá el clonado y snapshots de tablas eficientemente 16
  • 17. Contactos Todd Lipcon (Cloudera) Lars George (Cloudera) Michael Stack (StumbleUpon) Jean-Daniel Cryans (StumbleUpon) Nicolas Spiegelberg (Facebook) Jonathan Grey (Former VP of Data Engineering Team at Facebook, Founder at Continuuity) Andrew Purtell (Trend Micro) Lars Hofhansl (Salesforce.com) Doug Meil (CTO at Explorys) 17
  • 18. Recursos 18
  • 19. Recursos HBase at Explorys: How Big Data saved lives: http://www.slideshare.net/cloudera/from-big-data-to-lives-saved-hbase-in-heathca HBase and HDFS: Past, Present and Future por Todd Lipcon: http://www.slideshare.net/cloudera/1-todd-lipcon-past-present-futurepdf Powered by HBase's list: http://wiki.apache.org/hadoop/Hbase/PoweredBy 19