
Cuadernos de práctica con IAg Módulo 1-i
Compartir Noticias de IA generativa por Nicole Hennig
Modelos fundacionales
OpenAI – ChatGPT
12 days of OpenAI: The Ars Technica recap – Benj Edwards, Ars Technica
o3 – wow – AI explicado en YouTube
Muy interesante análisis de uno de mis canales favoritos de YouTube
ChatGPT adds more PC and Mac app integrations, getting closer to piloting your computer – Emilia David, VentureBeat
OpenAI’s new hotline: Chat with ChatGPT anytime, anywhere – Emilia David, VentureBeat
OpenAI updates ChatGPT Search with voice queries, faster results, mobile maps integration – Carl Franzen, VentureBeat
OpenAI launches ChatGPT Projects, letting you organize files, chats in groups – Emilia David, VentureBeat
ChatGPT gets screensharing and real-time video analysis, rivaling Gemini 2 – Emilia David, VentureBeat
OpenAI expands ChatGPT Canvas to all users – Emilia David, VentureBeat
Anthropic – Claude
Anthropic’s fastest model, Claude 3.5 Haiku, now generally available – Carl Franzen, VentureBeat
Google – Gemini
Ver comentario en: https://youtu.be/4ZE3sL-bsd8?si=E3AbO39texCrN2-x
Explicación de la IA «Si un modelo tiene un sentido verdaderamente poco común (lo que le permite aplastar pruebas increíblemente difíciles) pero ocasionalmente carece de sentido común, ¿qué vamos a hacer con él? Esa será una pregunta para 2025, sea cual sea su definición de AGI».
Si tienes Gemini Advanced, vale la pena probarlo… Es bastante sorprendente.
A phoenix in Silicon Valley: Google rises! – Azeem Azhar
” Cuando usas DeepResearch, se siente un poco como ciencia ficción. Aliméntelo con una consulta y entrará en acción, elaborando una estrategia de investigación a medida antes de ejecutarla metódicamente. El proceso, que se desarrolla durante varios minutos, implica que la IA merodee por bases de datos académicas y páginas web autorizadas antes de tejer sus hallazgos en una síntesis coherente».
Gemini 2.0 Flash ushers in a new era of real-time multimodal AI – Matt Marshall, VentureBeat
Gemini 2.0 Flash: An outstanding multi-modal LLM with a sci-fi streaming mode – Simon Willison
NotebookLM updates Business to Plus with more audio, lets all users interact with AI hosts – Emilia David, VentureBeat
Los gems de Google son excelentes para trabajo en los negocios pero solo son accesibles en la versión de pago, incluimos la referencia:
https://www.lavanguardia.com/andro4all/google/gems-de-google-gemini
Apple
With iOS 18.2, Apple Intelligence Finally Has Image Generation – Khamosh Pathak, Lifehacker
OpenAI rolls out ChatGPT for iPhone in landmark AI integration with Apple – Michael Nuñez, VentureBeat
The Inside Story of Apple Intelligence – Steven Levy, Wired
«Los líderes de Apple afirman que la compañía no llegó tarde a la IA generativa, sino que siguió lo que se ha convertido en su libro de jugadas familiar: tratar de ser el mejor, no el primero».
Microsoft Copilot Vision is here, letting AI see what you do online – Shubham Sharma, VentureBeat
Amazon
Amazon launches Nova AI model family for generating text, images and videos – Carl Franzen, VentureBeat
Meta
Meta launches open source Llama 3.3, shrinking powerful bigger model into smaller size – Carl Franzen, VentureBeat
Perplexity
Perplexity’s Carbon integration will make it easier for enterprises to connect their data to AI search – Shubham Sharma, VentureBeat
Perplexity acaba de adquirir esta startup (Carbon), para abordar la «brecha de datos» que las empresas encuentran con la búsqueda de IA y agilizar el proceso de descubrimiento de conocimiento en sus flujos de trabajo. Carbon ha desarrollado un marco de recuperación integral que agiliza el proceso de conexión de fuentes de datos externas a los LLM».
Otros modelos
UAE’s Falcon 3 challenges open-source leaders amid surging demand for small AI models – Shubham Sharma, VentureBeat
Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages – Taryn Plum, VentureBeat
Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king – Michael Nuñez, VentureBeat
DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch – Shubham Sharma, VentureBeat
Trying out QvQ—Qwen’s new visual reasoning model – Simon Willison
El equipo Qwen de Alibaba acaba de lanzar el QvQ-72B-Preview, con licencia de Qwen, «un modelo de investigación experimental que se centra en mejorar las capacidades de razonamiento visual».
Imágenes, video, música, y voces
Imágenes
Google’s New AI Image Tool ‘Whisk’ Lets You Use Photos as Prompts – Pesala Bandara, PetaPixel
Midjourney adds Pinterest-like ‘moodboards’ and support for multiple custom AI image models – Carl Franzen, VentureBeat
Art-Free Generative Models: Art Creation Without Graphic Art Knowledge – Hui Ren et al, arxiv
” Exploramos la pregunta: ‘¿Cuánto conocimiento previo de la técnica se necesita para crear arte?’ Para investigar esto, proponemos un modelo de generación de texto a imagen entrenado sin acceso a contenido relacionado con el arte. A continuación, presentamos un método simple pero efectivo para aprender un adaptador de arte utilizando solo unos pocos ejemplos de estilos artísticos seleccionados. Nuestros experimentos muestran que el arte generado con nuestro método es percibido por los usuarios como comparable al arte producido por modelos entrenados en grandes conjuntos de datos ricos en arte».
Video
Google debuts new AI video generator Veo 2 claiming better audience scores than Sora – Emilia David, VentureBeat
Pika 2.0 launches in wake of Sora, integrating your own characters, objects, scenes in new AI videos – Carl Franzen, VentureBeat
‘Not there yet’: Sora rollout receives mixed response from AI filmmakers citing inconsistent results, content restrictions – Carl Franzen, VentureBeat
Hunyuan Video
Página de inicio del último modelo de video de la empresa china TenCent.
Zack Snyder Thinks Hollywood Needs to Get on Board With AI or Get Left Behind – Marah Eakin, Wired
” Snyder dice que está especialmente intrigado por la idea de una IA que pueda entender el núcleo estético de una película o un cineasta, como si pudiera filmar la actuación de un actor y luego sincronizarla con un mundo de decorados creado por un diseñador de producción en una especie de «banco estético».
Música
Music Can Thrive in the AI Era – C. Brandon Ogbundo and Lupe Fiaso, Wired
«Si bien gran parte de esta alarma está bien fundada, también debemos considerar la posibilidad de que la creatividad humana pueda florecer en la era de la IA. En 2025, comenzaremos a ver esto manifestarse en nuestra respuesta cultural colectiva a la tecnología».
The first time AI made me weep – Conversación en Reddit Desplácese hacia abajo para escuchar a varias personas que disfrutan generando música con Suno y por qué lo encuentran tan terapéutico.
Voces (todo el mundo está copiando los podcasts de NotebookLM)
Illuminate | Learn Your Way – Google
Similar a NotebookLM, pero con más formas de personalizar y más voces.
Your content becomes conversations – Eleven Labs
Tu contenido se convierte en conversaciones «Sintonice mientras los coanfitriones de IA generan podcasts inteligentes a partir de cualquiera de sus archivos PDF, artículos, libros electrónicos y más. Ya disponible en la App de ElevenReader». En la app store solo está disponible la app para iPad o iPhone.
HeyGen also has a podcast generator (con avatares de vídeo), pero no suena ni de lejos tan humano como NotebookLM Audio Overviews. (en mi opinión)
Consejos
12 NotebookLM Epic Use Cases You Must Try – Skill Leap AI (YouTube)
El octavo caso de uso muestra cómo analizar un libro completo utilizando NotebookLM, aprovechando su gran ventana de contexto. A Tale of Two Cities se utiliza como ejemplo, demostrando la capacidad de generar rápidamente un briefing y acceder a puntos específicos dentro del libro a través de las referencias proporcionadas.
5 Best Midjourney Prompts: December 2024 (Photo Terms That Work) – Daniel Nest, ¿Por qué probar la IA? Foto GoPro de [sujeto] y más indicaciones útiles.
15 Times to use AI, and 5 Not to – Ethan Mollick
” Al igual que cualquier forma de sabiduría, el uso adecuado de la IA requiere tener en mente ideas opuestas: puede ser transformadora pero debe abordarse con escepticismo, poderosa pero propensa a fracasos sutiles, esencial para algunas tareas pero activamente dañina para otras. También quiero advertir que no debes tomarte esta lista demasiado en serio, excepto como inspiración: conoces mejor tu propia situación, y el conocimiento local importa más que cualquier principio general».
Accesibilidad
Study Uses AI to Interpret American Sign Language in Real-time – Gisele Galoustian, Florida Atlantic University News
Beyond Visual Limits: Systems Thinking for the Visually Impaired Using Generative AI – Allie Zombron et al, James Madison University
Solos launches AirGo Vision — ChatGPT-enabled AI smart glasses with a camera – Dean Takahashi, VentureBeat
Be My Eyes is rolling out on Ray Ban Meta glasses starting today! – Be My Eyes News

Deja un comentario