Boa tarde.
Acredito que você não vai achar esse tipo de informação aqui no forum. Sugiro que você primeiramente dê uma pesquisada na internet a respeito de "Visão Computacional". Se você é fluente em inglês sugiro que faça sua pesquisa nessa língua, pois são poucos os recursos gratuitos disponíveis nessa área em português.
Antes também de investir mais dinheiro com a compra de qualquer equipamento, se informe bem sobre o assunto pois acredito que uma câmera simples tipo uma WebCam não vá servir para esse tipo de aplicação por causa da maneira como ela captura a imagem.
Uma câmera de visão computacional geralmente captura a imagem em preto-e-branco com alto contraste (ou infravermelho caso você também precise de um mapeamento de altura) e a taxa de amostragem é bastante alta. Ela também possui diversos filtros incorporados em hardware (redução dinâmica de ruído, controle dinâmico de exposição, compensação de variação de luz, etc..) para melhorar o contorno externo da imagem facilitando assim o reconhecimento do perfil.
Depois vem toda a parte de I.A. para transformar a imagem em vetores, fazer o reconhecimento de blocos, perfis específicos, etc.. Se você não tiver um bom conhecimento em matemática e C/C++ você não vai conseguir sair do lugar...
Não quero te desanimar mas o problema é que o campo é muito vasto e um tanto quanto complexo. Apesar de parecer simples, não é bem assim... A simples tarefa de reconhecer um retângulo um uma imagem fotográfica arbitrária e achar seu centro é uma tarefa que vai requerer um bom esforço de sua parte e também uma boa dose de criatividade.
De qualquer forma, boa pesquisa e nos mantenha informado a respeito de suas descobertas...