- Muchas veces he explicado por aquí la creciente relevancia de los datos sintéticos frente al web scraping, cuestionando el manido concepto del 'colapso del modelo', pero no tenía una buena fuente a la que remitir a la gente para profundizar. A quien le interese, aquí tiene una 👇
- It took me weeks, but finally it's there: an overlong blogpost on synthetic pretraining. vintagedata.org/blog/posts/s...