Dynamic multi-product pricing under demand uncertainty and substitution effects : a gaussian process demand learning framework with genetic algorithm–based metaheuristic optimization
View/ Open
Date
2025Author
Advisor
Academic level
Master
Type
Subject
Abstract
This thesis investigates the integration of statistical learning and combinatorial optimization in multi-product dynamic pricing, a setting where demand uncertainty and substitution effects create both statistical and computational challenges. Pricing is formalized as an integer programming model that generalizes the classical Multiple-Choice Knapsack Problem by introducing an equality constraint on the total assortment price sum. This structure enables demand forecasts to be conditioned on the ...
This thesis investigates the integration of statistical learning and combinatorial optimization in multi-product dynamic pricing, a setting where demand uncertainty and substitution effects create both statistical and computational challenges. Pricing is formalized as an integer programming model that generalizes the classical Multiple-Choice Knapsack Problem by introducing an equality constraint on the total assortment price sum. This structure enables demand forecasts to be conditioned on the aggregate price level, thereby capturing substitution through relative price positioning over discrete price grids. Demand learning is performed with Gaussian Process Regression on own price and the aggregate sum, generating posterior means and variances that inform two policies: a greedy posteriormean rule that prioritizes exploitation, and Thompson Sampling via posterior draws that balances exploration with exploitation through uncertainty-aware experimentation. At each time period, price vectors are determined by two solvers: a linear-programming–based bounding method that leverages relaxations and analytical bounds to limit the number of exact solves, and a Genetic Algorithm metaheuristic that explores the discrete pricing space through population-based evolutionary mechanisms of elitist selection, crossover, and mutation, enabling scalable discovery of high-quality price vectors. The framework is evaluated in a synthetic logit demand environment across horizons, assortment sizes, price granularities, and demand noise levels. Performance is assessed in terms of cumulative revenue relative to a clairvoyant benchmark, predictive accuracy, computational efficiency, and intertemporal price stability. Results demonstrate that system behavior is governed not by learning policy or optimization in isolation, but by their interaction. Exact optimization with greedy forecasts produces smooth but rigid price paths that yield low returns under noisy demand, while sampling-based policies accelerate learning but induce price volatility when solved exactly. By contrast, the Genetic Algorithm consistently delivers higher realized revenues, smoother price trajectories, and substantially reduced computational effort—cutting runtime by over an order of magnitude in large, finely discretized price grids and larger assortments where exact solvers scale poorly. Populationbased search further tempers volatility from posterior sampling, filtering variability into structured adjustments that enhance exploration without destabilization. The central conclusion is architectural: learning policy and solver mechanics are interdependent levers whose joint design shapes revenue performance, stability, and tractability. The evidence shows that although metaheuristics accept bounded optimality gaps, they can, in practice, outperform exact methods in realized returns and operational stability by embedding structural diversity into the search process. The formulation is extensible to alternative objectives (e.g., profit), additional constraints (inventory, perishability, fairness), and richer contextual features, opening paths toward sequential decision-making frameworks that incorporate richer contextual features under joint constraints. ...
Abstract in Portuguese (Brasil)
Esta dissertação investiga a integração entre aprendizado estatístico e otimização combinatória no problema de precificação dinâmica de múltiplos produtos, um contexto em que a incerteza da demanda e os efeitos de substituição geram desafios simultaneamente estatísticos e computacionais. A precificação é formalizada como um modelo de programação inteira que generaliza o clássico Problema da Mochila de Múltipla Escolha ao introduzir uma restrição de igualdade sobre a soma total dos preços do sor ...
Esta dissertação investiga a integração entre aprendizado estatístico e otimização combinatória no problema de precificação dinâmica de múltiplos produtos, um contexto em que a incerteza da demanda e os efeitos de substituição geram desafios simultaneamente estatísticos e computacionais. A precificação é formalizada como um modelo de programação inteira que generaliza o clássico Problema da Mochila de Múltipla Escolha ao introduzir uma restrição de igualdade sobre a soma total dos preços do sortimento. Essa estrutura permite que as previsões de demanda sejam condicionadas ao nível agregado de preços, capturando assim os efeitos de substituição por meio do posicionamento relativo dos preços em grades discretas. O aprendizado da demanda é realizado com Regressão por Processos Gaussianos sobre o preço próprio e a soma agregada, produzindo médias e variâncias a posteriori que alimentam duas políticas: uma regra gulosa baseada na média a posteriori, que prioriza o aproveitamento de curto prazo, e o Thompson Sampling via amostragem a posteriori, que equilibra exploração e aproveitamento por meio de experimentação consciente da incerteza. Em cada período de decisão, os vetores de preços são determinados por dois resolvedores: um método de delimitação baseado em programação linear que utiliza relaxamentos e limites analíticos para reduzir o número de soluções exatas necessárias, e um Algoritmo Genético metaheurístico que explora o espaço discreto de precificação por meio de mecanismos evolutivos baseados em população — incluindo seleção elitista, crossover e mutação — permitindo a descoberta escalável de vetores de preços de alta qualidade. O framework é avaliado em um ambiente sintético com demanda do tipo logística, considerando diferentes horizontes temporais, tamanhos de sortimento, granularidades de preços e níveis de ruído na demanda. Os resultados demonstram que o comportamento do sistema não é determinado isoladamente pela política de aprendizado ou pelo método de otimização, mas sim pela interação entre ambos. A otimização exata com previsões gulosas gera trajetórias suaves, porém rígidas, que resultam em baixos retornos sob demanda ruidosa, enquanto políticas baseadas em amostragem aceleram o aprendizado mas induzem volatilidade de preços quando resolvidas de forma exata. Em contraste, o Algoritmo Genético entrega de forma consistente maiores receitas realizadas, trajetórias de preços mais suaves e um esforço computacional substancialmente reduzido — cortando o tempo de execução em mais de uma ordem de magnitude em grades de preços finamente discretizadas e sortimentos maiores, onde os resolvedores exatos apresentam baixa escalabilidade. A busca baseada em população atenua ainda mais a volatilidade proveniente da amostragem posterior, filtrando a variabilidade em ajustes estruturados que aprimoram a exploração sem gerar instabilidade. A conclusão central é arquitetural: a política de aprendizado e a mecânica do resolvedor são alavancas interdependentes, cujo desenho conjunto molda o desempenho em receita, a estabilidade e a tratabilidade. As evidências mostram que, embora as metaheurísticas aceitem lacunas de otimalidade limitadas, elas podem, na prática, superar métodos exatos em termos de retornos realizados e estabilidade operacional, ao incorporar diversidade estrutural no processo de busca. A formulação é extensível para objetivos alternativos (por exemplo, lucro), restrições adicionais (estoque, perecibilidade, equidade) e atributos contextuais mais ricos, abrindo caminhos para estruturas de tomada de decisão sequencial que incorporem características contextuais sob restrições conjuntas. ...
Institution
Universidade Federal do Rio Grande do Sul. Escola de Administração. Programa de Pós-Graduação em Administração.
Collections
-
Applied and Social Sciences (6415)Administration (2000)
This item is licensed under a Creative Commons License


