Caros,<br><br>estamos no Hackathon da Câmara Municipal, trabalhando com alguns dados de proposições de lei. Uma das coisas que queriamos fazer era 'georeferenciar' as proposições e visualizar mapas de influências.<br>

<br>Não manjo muito de processamento de linguagem natural e coisas afins. Alguém tem alguma luz de como extrair os endereços das ementas? Elas não seguem um formato muito específico... mas acho que tem elementos comuns o suficiente pra gente montar uma regra que funcione bem... mas antes de partir pruma série de regexes doidos, achei que valia um alô.<br>

<br>Os dados da Câmara estão aqui:<br><a href="http://www.camara.sp.gov.br/index.php?option=com_content&view=article&id=10008:detalhes-tramitacao-projetos-dados-abertos&catid=119">http://www.camara.sp.gov.br/index.php?option=com_content&view=article&id=10008:detalhes-tramitacao-projetos-dados-abertos&catid=119</a><br>

<br>E jogo alguns exemplos randomicamente extraidos dos projetos com a tag 'DENOMINAÇÃO':<br>AUTORIZA SEJA DADO O NOME DE LELLIS VIEIRA A UMA DAS RUAS DO PERIMETRO URBANO DA CAPITAL<br>DA A DENOMINACAO DE ITOBI ( CIDADE PAULISTA ) A UM DOS LOGRADOUROS PUBLICOS DO MUNICIPIO.<br>

DA A DENOMINACAO DE EDUARDO CINELLI A UMA VIAS PUBLICAS SITUADAS NO SUBDISTRITO DE JARDIM AMERICA NESTE MUNICIPIO.<br>AUTORIZA A DENOMINACAO DE DANTE CARRARO A UM DOS LOGRADOUROS PUBLICOS DA CIDADE.<br>DENOMINA RUA PROFESSOR FILADELFO DE AZEVEDO, TRECHO DA ATUAL RUA DO GADO.<br>

DENOMINA VIAS DE QUINTA DA PAINEIRAS, NO 27\xba SUBDISTRITO - VILA PRUDENTE<br><br>e por ai vai...<br><br>abs,<br>Pedro Markun<br>