关于各种其他流程可以自动化的想法和会议,每天都在各种规模的企业中产生。但是,除了可以花大量时间来创建模型外,还需要花时间评估模型并验证结果是否是随机的。实施后,必须监视并定期检查任何模型。
这些都是您在任何公司中都要经历的所有阶段,而不管其规模如何。如果我们谈论储蓄银行的规模和遗产,那么细微设置的数量将大大增加。到2019年底,Sberbank已经使用了2,000多种型号。仅开发模型还不够,还需要与工业系统集成,开发用于构建模型的数据集市以及对其在集群上的操作进行控制。
Sber.DS. , , , .
, , — , , Sber.DS. .
Sber.DS , , .

, . , , . .
. . .
. , — (). . , , , , .
, . . .
, . Jupyter Kernel Gateway , « ».

Sber.DS . , . , , . REST API. .
, : 4-8 . REST API (Open API). , , API , .
Java Spring Framework. , Red Hat OpenShift (Kubernetes). , ( , AutoML), .
«» , , , . : Hadoop, — OpenShift (Docker). , on-premise . , . – « » .
, - , Python Hadoop , , environment . C/C++ , Python , . , .
, . , . Hadoop Cloudera parcel. Hadoop docker-. python.eggs.
, Linux, , Linux namespace, , , , . . , , .

MVP , Python/R/Java Hadoop. environment Hadoop, .
, , DS- , , , data- . Spark-. , - dataset.
: Linux DevOps, Hadoop Spark, Java Spring, Scala Akka, OpenShift Kubernetes. , , , .