ClickHouse-Tabix中的视觉快速直观的数据分析。伊戈尔·史翠卡(Igor Strykhar)

我建议您熟悉Igor Strykhar撰写的2017年报告的抄本“ ClickHouse-Tabix中的视觉快速和视觉数据分析”。


Tabix项目中ClickHouse的Web界面。
主要特点:


  • 直接通过浏览器与ClickHouse一起使用,而无需安装其他软件;
  • 语法突出显示的查询编辑器
  • 团队自动完成;
  • 用于查询执行的图形分析工具;
  • 配色方案可供选择。



我是媒体技术总监2。我们是新闻交流新闻聚合器。我们存储了很多从合作伙伴那里收到的数据,并在ClickHouse中注册-大约每秒30,000个请求。


这些是数据,例如:


  • 新闻点击。
  • 在聚合器中显示新闻。
  • 在我们的网络上显示横幅。
  • 并且我们从自己的计数器注册事件,该计数器类似于Yandex.Metrica。这是我们自己的微量分析。


在ClickHouse之前,我们的生活非常忙碌。我们非常痛苦,试图将这些数据存储在某个地方并以某种方式进行分析。


ClickHouse之前的生活-infiniDB


我们拥有的第一件事是infiniDB。她和我们一起住了四年。我们开始困难。


  • . .
  • . , CSV- - .
  • . , . .
  • . , .

2016 , ClickHouse.


ClickHouse — Cassandra


. . infiniDB , , - , .


. Cassandra. Cassandra . 10 000 . 2 000 - .


. . , Cassandra. . .


ClickHouse – Druid


, . 2016 Druid.


Druid – , Java. . clickstream, - .


Druid 0.9.X.


. . - . .


, - . OpenSource – Tranquility, . , .


- . , , , , . - , . . . , , . . . , .



. , habr, , ClickHouse. , .


2 ClickHouse. . infiniDB – , Druid – . Cassandra . php Cassandra , .



? . . . . . ClickHouse – , .



, ClickHouse OpenSource, . 2 web, , , . . .



- ClickHouse. , :



, . . , .



, Druid. Druid, SuperSet. . Druid .


ClickHouse . . . , , : SELECT event, GROUP BY event. ClickHouse.



– Apache Zeppelin. . . , , . , - ClickHouse .


ClickHouse, . . , -. , . . .



– Redash.IO. Redash . . . . DataSource. . . ClickHouse, MySQL, PostgreSQL .



( 2017 ) Grafana. Grafana, , - , - ClickHouse . , . . . . - - , , ClickHouse.



. . EventSQL, SeperSet, Zeppelin.



? , , . ClickHouse – . , , . . . . , .



3 . 330 Tabix.


, ClickHouse-Frontend, . Tabix.


?


. SQL ClickHouse. .



Tabix. . – . – .



, .



, , . . ctrl , . Tabix , . . ClickHouse.



, , , . . , . , . . , .



, , , ClickHouse . - , ClickHouse join, . , - , , , . 200-300 , - - .


, ( 13:46 https://youtu.be/w1-XsL3nbRg?t=826)



, . – , . – workspace. . .


. , Tabix, .


Hotkey – ( 14:39 https://youtu.be/w1-XsL3nbRg?t=879)


hotkey . . , .



, . . sin, cos tg. , . . . . - . , - . , - , - .



. , Redmine Markdown. - , . , «Copy to Redmine» Redmine Markdown Where.



– . «date». ClickHouse - , , . . . , , . . , . . . , , - .


Tabix «Stats», , . . , . .


. ClickHouse, - . - .



– . , : sin, cos 0 299. «Draw» sin cos.



, . . . .



.



.



.



. , , , . . , . .



– Treemap.




Sankeys – . Streamgrahps, River. River. - . . .



– . , , , , , , , . , , .


, , .



Google map. , , Google map, .


, Tabix .



– ClickHouse. «», . , «referrer» - 730 Gb. , 700 GB, . . 2 TB, .


«request_id», . , .


.



– . realtime c ClickHouse , . Grafana. , .



– . , . , . , 200 GB . . . 30 GB, . . .



! OpenSource


. , , OpenSource, . .



, ? ?


, . ., , . . , OpenSource. MySQL , , PostgreSQL. . . Tabix ClickHouse, .


, . . , , , . , php , . . . . ? ? .


. . 330 . , , . 3 . Javascript. , , Javascript, . , – , . .


! . Tableau ?


. Tabix , .


?


, .


, *Tableau*? ?


ClickHouse. Tableau, . , Tabix . , CSV BI. - . , , – . 5 000 , 6 000 , , .


. . - , ?


. , 10 000 . ?


, ? , ?


, , . -. -, . Tabix .


. ?


, .


ClickHouse, ClickHouse production-?


, . . . production 3. ETL, . . . , . MongoDB, Cassandra, MySQL. ClickHouse . . 3 . 6 . ClickHouse.


, . . . .?


Google map, .. . , .


– Google map. «DRAW_GMAPS», . «DRAW_YMAPS», . . .. Javascript, . . , ClickHouse Javascript, . , . , . . , , . .


. . ?


. , , , .


! , ClickHouse , . , , ClickHouse, . , , , - ? , – . ?


– , , -. , Druid, roadmap - 50 % – , . , ClickHouse. , , roadmap. , Data Science, . Tabix – . , Zeppelin. . Redash , , . SuperSet , . , , .


, Pull request ?


.


! . – Javascript. Javascript - - ?*


Javascript.


?


Angular.


. . R *Shiny**?*


. .


.


. , , , .


*, , .


, . . : «- . , ». . , , . . . – , R , «R ».


!


. - , ?


CSV, Excel.


, , ? , .


«» « png, jpg».


!


P.S. - tabix


  • 解压缩,将目录复制build到nginx root_path
  • 配置nginx

All Articles