Início Ciência e tecnologia Maneiras rápidas de resolver problemas de planejamento complexos

Maneiras rápidas de resolver problemas de planejamento complexos

4
0

Quando alguns passageiros chegam ao final da linha de trem, eles devem viajar em uma plataforma de comutação para virar a estação para que possam deixar a estação mais tarde, geralmente da plataforma diferente da que vieram.

Os engenheiros usam programas de software conhecidos como solucionador algorítmico para planejar esses movimentos, mas fica muito complicado para um solucionador de maré tradicional bloquear o problema em uma estação com milhares de chegadas semanais e partida.

Usando o aprendizado de máquina, os pesquisadores do MIT criaram um sistema de planejamento avançado que reduz a solução a 50 % e cria uma solução que atenda ao objetivo do usuário, como deixar o trem pontual. O novo método pode ser usado para outros problemas logísticos complexos para resolver com eficiência, como funcionários do hospital, nomear equipes de companhias aéreas ou alocar trabalhos em máquinas de fábrica.

Os engenheiros geralmente quebram esses tipos de problemas nas seqüências de sub -sociedade sobrepostas que podem ser resolvidas em todas as vezes possíveis. No entanto, a sobreposição torna muitas decisões desnecessárias, por isso leva muito tempo para chegar a Salver na melhor solução.

Os novos métodos aprimorados pela inteligência artificial aprenderam que qualquer parte de cada subosver deve permanecer inalterada, essas variáveis ​​devem ser congeladas para evitar cálculos desnecessários. Em seguida, um solucionador algorítmico tradicional lidou com as variáveis ​​restantes.

“Muitas vezes, uma equipe dedicada pode passar alguns meses ou até alguns anos para projetar um algoritmo para resolver um problema a cabo. A educação moderna e profunda nos dá a chance de usar novos progressos para nos ajudar a fluir para o design desses algoritmos. Para o membro (Lead).

Ele se juntou ao artigo do autor Sirui Li, um estudante de pós -graduação da IDSS; Weinbin Owang, estudante de pós -graduação da CEE; E Yoning MA, um IDS PostDook. A pesquisa será apresentada na Conferência Internacional sobre Apresentação de Pesquisa.

Eliminação desnecessária

Uma inspiração para este estudo é um problema prático que é identificado no curso de transporte de Devin Camil Wilkins Wu, um aluno de mestrado. O aluno procurou aplicar o aprendizado de reforço para o verdadeiro problema de departamento de trem na estação norte de Boston. As empresas de trânsito precisam alocar muitos trens em um número limitado de plataformas, onde podem estar bem antes da chegada à estação.

Ele provou ser um problema de programação combinado muito complexo – o tipo adequado de laboratório passou os últimos anos trabalhando.

Em um grupo de máquinas envolvidas na determinação de um recurso limitado, como o trabalho de fábrica, no qual o trabalho da fábrica, os planejadores geralmente enquadram o problema como um cronograma flexível de lojas de trabalho.

No cronograma da loja de empregos flexíveis, cada tarefa é necessária para concluir uma quantidade separada de tempo, mas o trabalho pode ser atribuído a qualquer máquina. Ao mesmo tempo, cada tarefa é composta de operações que devem ser executadas na ordem correta.

Esses problemas nacionais rapidamente se tornam muito grandes e irracionais para as encostas tradicionais, para que os usuários possam recrutar a otimização do Horizon (RHO) para quebrar o problema que pode ser resolvido mais rapidamente.

Com o Rho, um usuário determina algumas das tarefas iniciais nas máquinas no horizonte de um plano específico, talvez na janela de quatro horas. Em seguida, eles executam a primeira tarefa dessa hierarquia e quatro horas planejam adicionar a próxima tarefa ao horizonte, até que todo o problema seja resolvido e até que o cronograma final da atribuição de tarefas-máquina seja criado.

O horizonte de um plano deve ser mais longo do que qualquer um dos períodos de trabalho, uma vez que o algoritmo, mesmo que essas tarefas sejam consideradas, a solução será melhor.

Mas quando o horizonte de planejamento progride, ele cria alguma sobreposição com as atividades no horizonte do plano anterior. O algoritmo já apresentou a solução inicial para essas operações sobrepostas.

“Talvez essas soluções iniciais sejam boas e não precisem contar novamente, mas talvez não sejam boas, este é o aprendizado de máquina aqui”, explica.

Para sua estratégia, que eles chamam de otimização do horizonte de guia de aprendizado (L-RHO), os pesquisadores ensinam um modelo de aprendizado de máquina para prever um modelo de aprendizado de máquina quando o horizonte do plano deve ser re-modificado.

O modelo L-RHO requer dados para o treinamento; portanto, os pesquisadores usam um conjunto de subconsismo usando um solucionador algorítmico clássico. Eles tomaram as melhores soluções – com operações máximas que não precisam ser recuperadas – e as usam como dados de treinamento.

Uma vez treinado, o modelo de aprendizado de máquina leva um novo subprobado que nunca foi visto antes e prevê que qualquer atividade não deve ser reconectada. As operações restantes são reembolsadas no solucionador algorítmico, que executa o trabalho, re -correção dessas atividades e move o plano para o plano. Então o loop começa novamente.

“Se, se no escuro, não precisarmos abri -los, poderá remover essas variáveis ​​do problema. Como esses problemas aumentam significativamente em tamanho, mas se pudermos soltar algumas dessas variáveis, pode ser bastante conveniente”, acrescentou.

Uma abordagem adaptável e perpleta

Para testar seus métodos, os pesquisadores comparam o L-RHO com vários solucionadores algorítmicos básicos, solucionador especial e métodos que simplesmente usam o aprendizado de máquina. Ele superou todos eles, reduziu o tempo da solução em 54 % e melhorou a qualidade da solução em até 21 %.

Além disso, seu método continua a exceder todas as linhas de base quando o examinam de uma forma mais complexa do problema, como as máquinas de fábrica quebram ou quando há tráfego extra de trem. Até os pesquisadores superaram a linha de base extra criada para desafiar seu solucionador.

“Todas essas variantes diferentes podem ser aplicadas à nossa abordagem sem mudar, o que é realmente o que queríamos fazer com esta linha de pesquisa”, diz ele.

Se o L-RHO alterar os objetivos, o problema criará automaticamente um novo algoritmo para resolver o problema-requer um novo conjunto de dados de treinamento.

No futuro, os pesquisadores querem entender melhor o argumento por trás da decisão de congelar algumas variáveis ​​de seu modelo, mas não para outras. Eles querem integrar sua abordagem com outros tipos de problemas de otimização complexos, como gerenciamento de inventário ou roteamento de veículos.

Este trabalho foi apoiado pela National Science Foundation, pelo Comitê de Assistência à Pesquisa do MIT, em uma bolsa de doutorado e em matemática da Amazon Robotics.

Source link