Plataformas de IAg (2)

Explicación de la IA «Si un modelo tiene un sentido verdaderamente poco común (lo que le permite aplastar pruebas increíblemente difíciles) pero ocasionalmente carece de sentido común, ¿qué vamos a hacer con él? Esa será una pregunta para 2025, sea cual sea su definición de AGI».

Si tienes Gemini Advanced, vale la pena probarlo… Es bastante sorprendente.

A phoenix in Silicon Valley: Google rises! – Azeem Azhar
” Cuando usas DeepResearch, se siente un poco como ciencia ficción. Aliméntelo con una consulta y entrará en acción, elaborando una estrategia de investigación a medida antes de ejecutarla metódicamente. El proceso, que se desarrolla durante varios minutos, implica que la IA merodee por bases de datos académicas y páginas web autorizadas antes de tejer sus hallazgos en una síntesis coherente».

Gemini 2.0 Flash ushers in a new era of real-time multimodal AI – Matt Marshall, VentureBeat

Gemini 2.0 Flash: An outstanding multi-modal LLM with a sci-fi streaming mode – Simon Willison

NotebookLM updates Business to Plus with more audio, lets all users interact with AI hosts – Emilia David, VentureBeat

Los gems de Google son excelentes para trabajo en los negocios pero solo son accesibles en la versión de pago, incluimos la referencia:

https://www.lavanguardia.com/andro4all/google/gems-de-google-gemini

Apple

With iOS 18.2, Apple Intelligence Finally Has Image Generation – Khamosh Pathak, Lifehacker

OpenAI rolls out ChatGPT for iPhone in landmark AI integration with Apple – Michael Nuñez, VentureBeat

The Inside Story of Apple Intelligence – Steven Levy, Wired
«Los líderes de Apple afirman que la compañía no llegó tarde a la IA generativa, sino que siguió lo que se ha convertido en su libro de jugadas familiar: tratar de ser el mejor, no el primero».

Microsoft Copilot Vision is here, letting AI see what you do online – Shubham Sharma, VentureBeat

Amazon

Amazon launches Nova AI model family for generating text, images and videos – Carl Franzen, VentureBeat

Meta

Meta launches open source Llama 3.3, shrinking powerful bigger model into smaller size – Carl Franzen, VentureBeat

Perplexity

Perplexity’s Carbon integration will make it easier for enterprises to connect their data to AI search – Shubham Sharma, VentureBeat
Perplexity acaba de adquirir esta startup (Carbon), para abordar la «brecha de datos» que las empresas encuentran con la búsqueda de IA y agilizar el proceso de descubrimiento de conocimiento en sus flujos de trabajo. Carbon ha desarrollado un marco de recuperación integral que agiliza el proceso de conexión de fuentes de datos externas a los LLM».

Otros modelos

UAE’s Falcon 3 challenges open-source leaders amid surging demand for small AI models – Shubham Sharma, VentureBeat

Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages – Taryn Plum, VentureBeat

Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king – Michael Nuñez, VentureBeat

DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch – Shubham Sharma, VentureBeat

Trying out QvQ—Qwen’s new visual reasoning model – Simon Willison
El equipo Qwen de Alibaba acaba de lanzar el QvQ-72B-Preview, con licencia de Qwen, «un modelo de investigación experimental que se centra en mejorar las capacidades de razonamiento visual».

Imágenes, video, música, y voces

Imágenes

Google’s New AI Image Tool ‘Whisk’ Lets You Use Photos as Prompts – Pesala Bandara, PetaPixel

Midjourney adds Pinterest-like ‘moodboards’ and support for multiple custom AI image models – Carl Franzen, VentureBeat

Art-Free Generative Models: Art Creation Without Graphic Art Knowledge – Hui Ren et al, arxiv
” Exploramos la pregunta: ‘¿Cuánto conocimiento previo de la técnica se necesita para crear arte?’ Para investigar esto, proponemos un modelo de generación de texto a imagen entrenado sin acceso a contenido relacionado con el arte. A continuación, presentamos un método simple pero efectivo para aprender un adaptador de arte utilizando solo unos pocos ejemplos de estilos artísticos seleccionados. Nuestros experimentos muestran que el arte generado con nuestro método es percibido por los usuarios como comparable al arte producido por modelos entrenados en grandes conjuntos de datos ricos en arte».

Video

Google debuts new AI video generator Veo 2 claiming better audience scores than Sora – Emilia David, VentureBeat

Pika 2.0 launches in wake of Sora, integrating your own characters, objects, scenes in new AI videos – Carl Franzen, VentureBeat

‘Not there yet’: Sora rollout receives mixed response from AI filmmakers citing inconsistent results, content restrictions – Carl Franzen, VentureBeat

Hunyuan Video
Página de inicio del último modelo de video de la empresa china TenCent.

Zack Snyder Thinks Hollywood Needs to Get on Board With AI or Get Left Behind – Marah Eakin, Wired
” Snyder dice que está especialmente intrigado por la idea de una IA que pueda entender el núcleo estético de una película o un cineasta, como si pudiera filmar la actuación de un actor y luego sincronizarla con un mundo de decorados creado por un diseñador de producción en una especie de «banco estético».

Música

Music Can Thrive in the AI Era – C. Brandon Ogbundo and Lupe Fiaso, Wired
«Si bien gran parte de esta alarma está bien fundada, también debemos considerar la posibilidad de que la creatividad humana pueda florecer en la era de la IA. En 2025, comenzaremos a ver esto manifestarse en nuestra respuesta cultural colectiva a la tecnología».

The first time AI made me weep – Conversación en Reddit Desplácese hacia abajo para escuchar a varias personas que disfrutan generando música con Suno y por qué lo encuentran tan terapéutico.

Voces (todo el mundo está copiando los podcasts de NotebookLM)

Illuminate | Learn Your Way – Google
Similar a NotebookLM, pero con más formas de personalizar y más voces.

Your content becomes conversations – Eleven Labs

Tu contenido se convierte en conversaciones «Sintonice mientras los coanfitriones de IA generan podcasts inteligentes a partir de cualquiera de sus archivos PDF, artículos, libros electrónicos y más. Ya disponible en la App de ElevenReader». En la app store solo está disponible la app para iPad o iPhone.

HeyGen also has a podcast generator (con avatares de vídeo), pero no suena ni de lejos tan humano como NotebookLM Audio Overviews. (en mi opinión)

Consejos

12 NotebookLM Epic Use Cases You Must Try – Skill Leap AI (YouTube)
El octavo caso de uso muestra cómo analizar un libro completo utilizando NotebookLM, aprovechando su gran ventana de contexto. A Tale of Two Cities se utiliza como ejemplo, demostrando la capacidad de generar rápidamente un briefing y acceder a puntos específicos dentro del libro a través de las referencias proporcionadas.

5 Best Midjourney Prompts: December 2024 (Photo Terms That Work) – Daniel Nest, ¿Por qué probar la IA? Foto GoPro de [sujeto] y más indicaciones útiles.

15 Times to use AI, and 5 Not to – Ethan Mollick
” Al igual que cualquier forma de sabiduría, el uso adecuado de la IA requiere tener en mente ideas opuestas: puede ser transformadora pero debe abordarse con escepticismo, poderosa pero propensa a fracasos sutiles, esencial para algunas tareas pero activamente dañina para otras. También quiero advertir que no debes tomarte esta lista demasiado en serio, excepto como inspiración: conoces mejor tu propia situación, y el conocimiento local importa más que cualquier principio general».

Accesibilidad

Study Uses AI to Interpret American Sign Language in Real-time – Gisele Galoustian, Florida Atlantic University News

Beyond Visual Limits: Systems Thinking for the Visually Impaired Using Generative AI – Allie Zombron et al, James Madison University

Solos launches AirGo Vision — ChatGPT-enabled AI smart glasses with a camera – Dean Takahashi, VentureBeat

Be My Eyes is rolling out on Ray Ban Meta glasses starting today! – Be My Eyes News

Plataformas de IAg (2)

Comentarios

Deja un comentario Cancelar la respuesta

Plataformas de IAg (2)

Comparte esto:

Comentarios

Deja un comentario Cancelar la respuesta