Atendiendo Lun - Vie 8:00-5:00
E-mail contacto@ActivaSolutions.com Llámenos! +504 2557-5654

Lo nuevo en IBM SPSS STATISTICS 26.0

A. Módulo BASE:
 Nuevo Análisis ROC
 Nuevo estadístico en Análisis de Fiabilidad
 Mejoras de secuencias de comandos MATRIX
 Nueva opción en la Facilidad de Producción
B. Módulo REGRESSION:
 Nueva Regresión Cuantil
C. Módulo Estadísticas AVANZADAS:
 Nuevos procedimientos bayesianos
 Mejoras de los scripts MIXED y GENLINMIXED .

A. Módulo BASE:
A. Análisis ROC: El nuevo procedimiento ROC facilita la evaluación de
la precisión y el rendimiento de los modelos de clasificación
predictiva. El análisis ROC (Receiver Operating Characteristic o
Características de operación del receptor) se ocupa
específicamente de la precisión de la clasificación de los modelos,
especialmente en lo que respecta a las relaciones entre las
clasificaciones precisas (conocidas como los positivos verdaderos y
los negativos verdaderos) y las predicciones inexactas (los positivos
falsos y los falsos
negativos). Estos a
menudo están
representados por una
curva ROC que traza
la tasa de verdaderos
positivos (TPR) contra
la tasa de falsos
positivos (FPR) en
varias configuraciones
de umbral. También
incluye curvas de
recuperación de
precisión (PR) y proporciona opciones para comparar dos o más
curvas ROC que se generan a partir de grupos independientes o
sujetos emparejados. Las curvas PR representan la precisión frente
a la exhaustividad, tienden a ser más informativas cuando las
muestras de datos observados son muy asimétricas, y proporcionan una alternativa a las curvas ROC para datos con una alta asimetría en la distribución de clase.
El área bajo la curva ROC (AUC) formula un estadístico importante
que representa la mejor probabilidad de seleccionar el mejor modelo
de predicción.

Ejemplo
En la base de datos
“Bankloan.sav” un banco tiene 
interés en clasificar a sus
clientes dependiendo de si se
retrasarán o no en el pago de
sus préstamos (variable
“impago”); por lo tanto, se
desarrollaron 3 modelos para
tomar estas decisiones. Se
puede utilizar el Análisis ROC para evaluar y valorar la precisión de
las predicciones del modelo.

 

B. Análisis de Fiabilidad: Nuevo análisis múltiple kappa de Fleiss
para mejorar el análisis de una 
encuesta. Evalúa el acuerdo
entre evaluadores para
determinar la fiabilidad entre
diversos evaluadores. Se puede
calcular tanto el kappa de Fleiss
como el kappa de Cohen. El
kappa de Cohen es un
estadístico que suele utilizarse
para medir la concordancia en las evaluaciones entre 2 evaluadores.
El kappa de Fleiss es una generalización del kappa de Cohen para
más de 2 evaluadores. Un acuerdo más alto proporciona más
confianza en las valoraciones que reflejan las circunstancias reales.

Ejemplo
En la base de datos “survey_sample.sav” se pregunta ¿El cuestionario mide la satisfacción del cliente de manera útil? El análisis de fiabilidad le permitirá determinar el grado en que los elementos del cuestionario se relacionan entre sí, obtener un índice global de la replicabilidad o de la consistencia interna de la escala en su conjunto e identificar elementos problemáticos que deberían ser excluidos de la escala

 

Mejoras de secuencias de comandos en la sintaxis MATRIX-END
MATRIX: Los comandos MATRIX y END MATRIX encierran instrucciones que son ejecutadas por el procesador de matriz. Usando programas matriciales, puede escribir sus propias rutinas estadísticas en el lenguaje compacto del álgebra matricial. Los programas matriciales pueden incluir cálculos matemáticos, estructuras de control, visualización de resultados y matrices de lectura y escritura como archivos de caracteres o archivos de datos. o Los nombres de variables largos (hasta 64 bytes) se pueden usar para nombrar una matriz o un nombre de vector (como COMPUTE, CALL, PRINT, READ, WRITE, GET, SAVE,
MGET, MSAVE, DISPLAY, RELEASE, etc.).

  • Los nombres de variable que se incluyen en un vector u objeto
    de matriz se truncan a 8 bytes. Esto se debe a que la
    estructura de matriz / vector es una matriz de números, y cada
    número puede coincidir con una cadena de hasta 8 bytes. Los
    nombres largos (hasta 64 bytes) son compatibles solo cuando
    se especifican explícitamente.
    o Los nombres de variables largos son compatibles con los
    comandos GET y SAVE cuando se especifican explícitamente
    en el subcomando / VARIABLES (y cuando se especifican en
    el subcomando / STRINGS para el comando SAVE). Los
    nombres de variables para los comandos GET y SAVE se
    truncan a 8 bytes cuando se hace referencia a través de un
    vector en el subcomando / NAMES.
    o Las declaraciones GET, SAVE, MGET o MSAVE admiten
    tanto referencias de conjuntos de datos como especificaciones
    de archivos físicos.
    o MATRIX-END MATRIX ahora admite funciones estadísticas
    que anteriormente solo eran compatibles con el comando
    COMPUTE (por ejemplo, IDF.CHISQ, CDF.NORMAL,
    NCDF.F, etc.).
  • Los nombres de variable que se incluyen en un vector u objeto
    de matriz se truncan a 8 bytes. Esto se debe a que la
    estructura de matriz / vector es una matriz de números, y cada
    número puede coincidir con una cadena de hasta 8 bytes. Los
    nombres largos (hasta 64 bytes) son compatibles solo cuando
    se especifican explícitamente.
  • Los nombres de variables largos son compatibles con los
    comandos GET y SAVE cuando se especifican explícitamente
    en el subcomando / VARIABLES (y cuando se especifican en
    el subcomando / STRINGS para el comando SAVE). Los
    nombres de variables para los comandos GET y SAVE se
    truncan a 8 bytes cuando se hace referencia a través de un
    vector en el subcomando / NAMES.
  • Las declaraciones GET, SAVE, MGET o MSAVE admiten
    tanto referencias de conjuntos de datos como especificaciones
    de archivos físicos.
  • MATRIX-END MATRIX ahora admite funciones estadísticas
    que anteriormente solo eran compatibles con el comando
    COMPUTE (por ejemplo, IDF.CHISQ, CDF.NORMAL,
    NCDF.F, etc.).

Facilidad de producción: Ahora los modificadores de la línea de comandos permiten al usuario programar los trabajos de producción automáticamente para que se ejecuten cada cierto tiempo con utilidades de programación disponibles en su sistema operativo. Puede ejecutar trabajos de producción desde una línea de comandos con los siguientes modificadores:

-production [prompt|silent]. Inicia la aplicación en modo de producción. Las palabras clave prompt y silent especifican si se desea mostrar el cuadro de diálogo que solicita los valores en tiempo de ejecución, en caso de que se hayan especificado en el trabajo.

-symbol . Lista de parejas símbolo-valor utilizadas en el trabajo de producción. Deben definirse los símbolos en el trabajo de producción mediante la pestaña Valores de tiempo de ejecución. o -background. Ejecute el trabajo de producción en el fondo de un servidor remoto. Su equipo local no tiene por qué estar encendido o quedarse conectado al servidor remoto. Puede desconectar y recuperar los resultados más tarde. o Para ejecutar trabajos de producción en un servidor remoto, se debe introducir la información de acceso al servidor: -server o -server . Nombre o dirección IP y número de puerto del servidor. Sólo Windows.

B. Módulo REGRESSION:
 Nueva Regresión Cuantil: Hay
una nueva opción en el menú de
Regresiones que permite realizar
regresiones y gráficas que
muestran diferentes líneas de
ajuste para percentiles
separados. Con esto se pueden
producir predicciones separadas
para las diferentes partes de la
distribución de la variable
dependiente. En cambio, al utilizar la Regresión lineal estándar en el
mismo conjunto de datos, se obtiene una fórmula única para estimar
la proyección de la variable dependiente.

Ejemplo : En la base de datos “Employee data.sav” se analiza si hay diferencias en la relación de salarios inicial y actual de los
empleados comparando los datos en el 10% superior de la distribución actual del salario y en el 25% inferior. La regresión por
cuantiles produce coeficientes y valores de intercepción separados para cada cuantil solicitado.

 

C. Módulo Estadísticas Avanzadas:
 Nuevas Estadísticas Bayesianas

  • Medidas repetidas unidireccionales ANOVA: La mejora de las medidas repetidas permite al analista adoptar un enfoque bayesiano para comparar cualquier cambio en un factor dado para el mismo sujeto en diferentes puntos de tiempo o condiciones. Se supone que cada sujeto tiene una única observación para cada punto de tiempo.
  • Una muestra de mejoras binomiales: Aquí, el usuario puede aplicar una prueba binomial bayesiana para intentar determinar la probabilidad de que la proporción observada entre dos grupos sea la misma que la proporción supuesta en la población.
  • Una muestra de mejoras de Poisson: Al igual que en el procedimiento anterior, excepto aquí, el usuario puede comparar sus datos con lo bien que se ajusta a una distribución de Poisson. Estas distribuciones son un modelo útil para eventos raros como accidentes o reclamaciones de seguros. Se utiliza un conjugado anterior dentro de la familia de distribución Gamma cuando se dibuja la inferencia estadística bayesiana sobre la distribución de Poisson.

 

Mejoras de los scripts MIXED y GENLINMIXED:
o Comando GENLINMIXED:

  • Nuevas estructuras tipo Covariance ARH1 y CSH,
    efectos aleatorios. Las opciones de CSH y ARH1
    se agregaron al subcomando / RANDOM (palabra
    clave COVARIANCE_TYPE).
  • Nuevas estructuras tipo Covariance ARH1 y CSH,
    efectos repetidos. Las opciones de CSH y ARH1
    se agregaron al subcomando / DATA_STRUCTURE
    (palabra clave COVARIANCE_TYPE).
     La opción KENWARD_ROGER se agregó al
    subcomando / BUILD_OPTIONS (palabra clave
    DF_METHOD).
  • Tipos de covarianza de Kronecker. Las opciones
    UN_AR1, UN_CS, UN_UN se agregaron al
    subcomando / DATA_STRUCTURE (palabra clave
    COVARIANCE_TYPE).
  • Nueva palabra clave KRONECKER_MEASURES.
    La palabra clave se utiliza para especificar una lista
    de variables para el subcomando /
    DATA_STRUCTURE. La palabra clave se debe
    utilizar solo cuando COVARIANCE_TYPE es uno de
    los tres tipos de Kronecker. Las reglas para
    KRONECKER_MEASURES son las mismas que
    para REPEATED_MEASURES. Cuando ambas
    especificaciones están vigentes, pueden tener o no
    campos comunes, pero no pueden ser exactamente
    iguales (independientemente de que estén en el
    mismo orden).
    Comando MIXTO:
    Se introdujo la palabra clave DFMETHOD en el
    subcomando CRITERIOS.
     La palabra clave KRONECKER se agregó al
    subcomando REPEATED. La palabra clave debe
    usarse solo cuando COVTYPE es uno de los tres
    tipos siguientes de Kronecker.
     Las opciones UN_AR1, UN_CS y UN_UN se
    agregaron a la palabra clave COVTYPE en el
    subcomando REPEATED.

 

 

 

Leave a Reply

Time limit is exhausted. Please reload the CAPTCHA.

Antes de publicar, por favor, hacer la siguiente operación.

Cuanto es: 8 + 6?