Pourquoi une telle coexistence de deux codes neuronaux distincts, l'un avec une variation monotone du taux de décharge en fonction de la numérosité, l'autre avec une courbe d'accord à une numérosité préférée ? Il convient d'interpréter ces résultats avec prudence, dans la mesure où ces deux populations de neurones n'ont été observées que très récemment, dans des laboratoires différents, chez des animaux différents et entraînés à des tâches numériques différentes. Toutefois, ces résultats s'accordent bien avec un modèle théorique qui suppose que les neurones monotones et accordés constituent deux étapes distinctes de l'extraction d'une représentation invariante de la numérosité (Dehaene & Changeux, 1993 ; Verguts & Fias, 2004). Selon ce modèle, la numérosité approximative peut être extraite d'une carte rétinienne détaillée en trois étapes successives : (1) codage rétinotopique des positions occupées par les objets, indépendamment de leur identité et de leur taille, donc avec une quantité fixe d'activation pour chaque objet ; (2) addition approximative de ces activations à travers l'ensemble de la carte, par le moyen de « neurones d'accumulation » dont le niveau d'activité varie de façon monotone en fonction de la numérosité ; (3) seuillage de cette activation par des neurones avec des seuils croissants et une forte inhibition latérale, ce qui conduit à une population de neurones accordés aux différentes numérosités. La simulation de ce modèle par ordinateur, sous forme d'un réseau de neurones formels, montre qu'on aboutit naturellement, à ce dernier niveau, à un codage log-Gaussien de la numérosité. Avec quelques adaptations, les neurones d'accumulation peuvent être identifiés aux neurones de l'aire LIP étudiés par Roitman et coll., tandis que les neurones accordés à la numérosité correspondraient aux neurones de l'aire LIP enregistrés par Nieder et Miller. Il est à noter qu'anatomiquement, les neurones de LIP projettent effectivement vers ceux de VIP. De plus, les neurones de VIP semblent répondre à l'ensemble du champ visuel, ce qui est compatible avec l'hypothèse qu'ils reçoivent des entrées convergentes de nombreux neurones rétinotopiques de l'aire LIP.
À partir de ce code neural log-Gaussien, un modèle mathématique de prise de décision, capable de rendre compte des taux d'erreurs et des temps de réponse dans diverses tâches numériques élémentaires, a également été développé (Dehaene, 2007). Lorsque la décision est prise en un temps fixe, sans pression de rapidité, et que seul le taux d'erreurs doit donc être modélisé, la théorie de la détection du signal peut être appliquée très directement au code log-Gaussien. Ce modèle rend bien compte des compétences animales et humaines dans des tâches élémentaires de comparaison pareil-différent ou plus grand-plus petit (Dehaene, 2007 ; Piazza et al., 2004). Il peut également être adapté à la dénomination des numérosités (Izard & Dehaene, 2008) et à l'addition ou à la soustraction de deux numérosités, moyennant quelques hypothèses supplémentaires sur la combinaison des variances associées à chaque opérande (Barth et al., 2006 ; Cantlon & Brannon, 2007).
Lorsque la tâche implique une décision rapide en temps limité, la modélisation du temps de réponse fait appel à un modèle mathématique plus sophistiqué. Ce modèle se fonde sur les travaux de Mike Shadlen qui indiquent que la prise de décision en temps réel, sur la base de signaux bruités, s'appuie sur certains neurones pariétaux et préfrontaux qui réalisent une accumulation des données stochastiques que les stimuli apportent en faveur de chacune des réponses possibles. Cette accumulation peut alors décrite mathématiquement comme une marche aléatoire apparentée à un mouvement Brownien. La décision est prise lorsque, pour l'un des réponses, la marche aléatoire de l'accumulateur atteint un seuil fixé à l'avance. La réponse correspondante est alors sélectionnée. On peut démontrer que ce mécanisme d'accumulation statistique avec seuil constitue un mécanisme optimal de prise de décision en temps réel (Gold & Shadlen, 2002).
L'analyse montre qu'au moins dans des tâches très simples telles que la comparaison de deux nombres, le modèle log-Gaussien doublé d'une prise de décision par accumulation conduit à des prédictions très étroitement ajustées aux données expérimentales. L'influence de la distance entre les nombres à comparer est correctement modélisée, et le modèle explique pourquoi la forme de cet effet diffère selon que l'on considère le taux d'erreur ou le temps de réponse moyen. La distribution des temps de réponse, et la manière dont celle-ci varie avec la présence d'une tâche interférente, sont également expliqués en grand détail (Sigman & Dehaene, 2005).