Descenso del Gradiente

Es un algoritmo de optimización utilizado para encontrar el mínimo de una función, especialmente en el contexto del aprendizaje automático y la optimización numérica. El objetivo del descenso del gradiente es ajustar los parámetros de un modelo de manera iterativa para minimizar una función de pérdida.

Su nombre proviene del hecho de que estamos "descendiendo" por la superficie de la función de pérdida siguiendo la dirección más pronunciada de descenso, que es el gradiente. Es un algoritmo fundamental en el campo del aprendizaje automático y se utiliza en una variedad de contextos, desde la regresión lineal hasta el entrenamiento de redes neuronales profundas.

Pasos a Seguir en la Construcción del Algoritmo

Inicialización de Parámetros

Comenzamos con un conjunto inicial de parámetros para nuestro modelo. En nuestro caso es la posición inicial en la función de pérdida, el valor de la tasa de apredizaje (lr) y el valor de h, la variación en la derivada.

Cálculo del Gradiente

Calculamos el gradiente de la función de pérdida con respecto a los parámetros actuales. El gradiente indica la dirección y la magnitud del cambio más pronunciado en la función de pérdida. Queremos mover nuestros parámetros en la dirección opuesta al gradiente para minimizar la función de pérdida.

$$ f'(x) \approx \frac{f(x + h) - f(x)}{h} $$

Se utilizó esta expresión, se tuvo en cuenta que la función de pérdida (función de error) es un plano de 2 dimensiones.

Actualización de Parámetros

Ajustamos los parámetros en la dirección opuesta al gradiente multiplicado por una tasa de aprendizaje. La tasa de aprendizaje controla qué tan grande es el paso que damos en cada iteración. Una tasa de aprendizaje más grande puede llevar a convergencia más rápida, pero también puede hacer que el algoritmo sea inestable o que se salte mínimos locales. Por otro lado, una tasa de aprendizaje más pequeña puede hacer que la convergencia sea más lenta pero más precisa.

Construcción del paso

$$A_{n+1} = A_n -lr\nabla f(A_n)$$

Donde:

$A_n$ : Punto actual.
$A_{n+1}$ : El siguiente punto, después de sumar la variación.
$lr$ : La tasa de aprendisaje (learning rate).
$\nabla f(A_n)$ : Derivada parcial de la función de pérdida, evaluada en el punto actual.

Repetición

Repetimos hasta que se satisfaga algún criterio de parada, como un número máximo de iteraciones alcanzado, una tolerancia para la convergencia, o cualquier otro criterio definido por el usuario.

Convergencia

Esperamos que con suficientes iteraciones y una elección adecuada de la tasa de aprendizaje, el algoritmo converja a un mínimo local o global de la función de pérdida.

Gráfica de las Curvas de nivel de la Función de Pérdida

El punto verde es el valor de inicio, los amarillos son el recorrido y el rojo es el punto final.

En nuestro caso la función de pérdida se construyó a partir de una funcion lienal

$$ Y = mX +b $$

Por lo que al finalizar el desencenso obtenemos los valores del la pendiente y el corte con el eje y.

Autor

José R. Guignan
Mail: joserguignan@gmail.com
Linkedin: https://www.linkedin.com/in/jrguignan

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
images		images
README.md		README.md
descenso_del_gradiente.ipynb		descenso_del_gradiente.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Descenso del Gradiente

Pasos a Seguir en la Construcción del Algoritmo

Inicialización de Parámetros

Cálculo del Gradiente

Actualización de Parámetros

Construcción del paso

Donde:

Repetición

Convergencia

Gráfica de las Curvas de nivel de la Función de Pérdida

Autor

About

Releases

Packages

Languages

jrguignan/Descenso_del_Gradiente-from_scratch

Folders and files

Latest commit

History

Repository files navigation

Descenso del Gradiente

Pasos a Seguir en la Construcción del Algoritmo

Inicialización de Parámetros

Cálculo del Gradiente

Actualización de Parámetros

Construcción del paso

Donde:

Repetición

Convergencia

Gráfica de las Curvas de nivel de la Función de Pérdida

Autor

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages