Aprendizado de máquina do Android

Olá Habr! Apresento a você a tradução de um artigo da revista APC .

O aprendizado de máquina e a mineração de dados são os desenvolvimentos práticos da IA, graças aos quais aplicações de vários tópicos aparecem, variando da aeronáutica à zoologia. Esses processos costumam ser realizados na nuvem, em um PC ou laptop, e muito menos em um smartphone.

No entanto, recentemente, um novo aplicativo gratuito chamado "DataLearner" apareceu no Google Play, com o qual você pode extrair dados. Não requer recursos externos e acesso com privilégios de superusuário.

Recursos de computação para smartphones


Muitas pessoas acreditam erroneamente que o aprendizado de máquina e a mineração de dados exigem muitos recursos de computação em nuvem, ou pelo menos um computador poderoso. No entanto, no final das contas, tudo se resume ao tamanho dos dados que estão sendo analisados ​​e ao tipo de aprendizado de máquina que você deseja aplicar.

O treinamento em informática tem seus próprios níveis de dificuldade. Se você imagina que uma técnica de aprendizado profundo recentemente emergente como a rede neural convolucional (CNN) é um carro com alta densidade de potência, outras técnicas, como a árvore de decisão e muitos outros métodos de treinamento "florestal", são "hatchbacks" quentes. Eles mostram excelentes resultados, rápidos e fáceis, mesmo com recursos limitados de computação da CPU.

Aplicativo de processamento de dados


O Google lançou recentemente o TensorFlow Lite. Esta aplicação é para smartphones e a Internet das coisas, projetada para treinamento aprofundado de objetos físicos. No entanto, o DataLearner seguiu o outro caminho. Ele suporta algoritmos de classificação tradicionais, como NaïveBayes e Random Fores. Todos eles serão armazenados no seu telefone e não exigirão a participação de terceiros para obter acesso a eles.

O DataLearner combina os principais componentes do aplicativo de mineração de dados de código aberto Weka com os novos algoritmos de aprendizado baseados em computador desenvolvidos pela Universidade Charles Sturt, na Austrália. O aplicativo é autônomo, ou seja, Não requer computação em nuvem ou conexão com a Internet para operação normal. O programa não solicita acesso com privilégios de superusuário, não coleta informações sobre você (exceto os dados que o Google recebe dos arquivos de inicialização no Google Play) e é suportado em todos os dispositivos com Android 4.0 ou superior. É fácil de gerenciar, graças a uma interface de usuário simples, composta por três telas principais.

Quando o aplicativo é iniciado, uma tela de carregamento é exibida, na qual é possível baixar pacotes de dados CSV ou ARFF. Eles podem ser salvos localmente ou em downloads. Para o formato CSV, é necessária uma linha de cabeçalho. Após o carregamento, você verá informações gerais sobre os dados, incluindo tipos e número de parâmetros, além de atributos de classe.

Escolha o seu algoritmo


Se você deslizar a tela para a esquerda, uma janela é aberta, onde você pode escolher um dos 40 algoritmos para reconhecimento de padrões no pacote de dados. Recuperação de informações - em essência, é a alocação de padrões nos dados e os relacionamentos entre vários atributos e atributos. Não existe um algoritmo perfeito e, portanto, o DataLearner fornece uma ampla variedade de opções. Além do grande número de algoritmos dos desenvolvedores do aplicativo Weka, a lista contém vários novos métodos criados pela equipe da Universidade Charles Sturt, por exemplo, ForestPA, SysFor e SPAARC.

Execute seu algoritmo


Aqui começa a diversão.

Você não precisa fazer nada, exceto pressionar o botão 'Executar'. O DataLearner fará o resto. Primeiro, ele criará um modelo de seus dados, ou seja, correlaciona atributos entre si.
O atributo de classe define a lista agrupada à qual cada pacote de dados pertence. Por exemplo, uma versão demo padrão de um pacote de dados fornece indicadores climáticos, como temperatura, umidade, direção do vento e precipitação nos últimos dias. E você extrai os dados para descobrir se há algum padrão em como esses indicadores climáticos se relacionam com o fato de estar chuvoso ou não naquele dia.

O aplicativo faz uma verificação cruzada do conjunto de regras ou "modelo" criado usando um método chamado "validação cruzada de 10 passagens" para descobrir quais são seus recursos preditivos. Como resultado, você obtém uma análise matemática, cujo principal resultado é a porcentagem de precisão. Ele aparecerá na parte superior da tela.

Clique no botão 'Visualizar detalhes / matriz' na parte inferior da tela e você obterá informações mais detalhadas sobre o modelo e como ele funciona. Aqui, informações sobre padrões serão apresentadas de uma forma mais visual.

Você também precisa se lembrar da quantidade de dados carregados para processamento: apesar do desempenho dos processadores móveis, você não deve esperar a mesma velocidade deles da AWS ou do Google Cloud. Além disso, não espere que você possa fazer upload de dados de tráfego do Facebook nos últimos dez anos, e o programa os processará por ... não, nunca os processará. No entanto, existem muitos aplicativos com fontes de informação mais modestas, cujo processamento seria perfeito para o smartphone.

Calculadora de bolso


O DataLearner não substituirá o aprendizado de máquina baseado em nuvem em breve, mas esse não é o seu objetivo. Em vez disso, o aplicativo é uma solução totalmente portátil que cabe no seu bolso e não requer um cabo de alimentação ou Internet. O aplicativo pode ser baixado gratuitamente no Google Play . O código fonte licenciado da GPL3 também está disponível no GitHub .

Source: https://habr.com/ru/post/undefined/


All Articles