core/crypto/aes-gcm-ghash-tbl.c

*b8c186b5SJens Wiklander/*
*b8c186b5SJens Wiklander *  NIST SP800-38D compliant GCM implementation
*b8c186b5SJens Wiklander *
*b8c186b5SJens Wiklander *  Copyright (C) 2006-2015, ARM Limited, All Rights Reserved
*b8c186b5SJens Wiklander *  SPDX-License-Identifier: Apache-2.0
*b8c186b5SJens Wiklander *
*b8c186b5SJens Wiklander *  Licensed under the Apache License, Version 2.0 (the "License"); you may
*b8c186b5SJens Wiklander *  not use this file except in compliance with the License.
*b8c186b5SJens Wiklander *  You may obtain a copy of the License at
*b8c186b5SJens Wiklander *
*b8c186b5SJens Wiklander *  http://www.apache.org/licenses/LICENSE-2.0
*b8c186b5SJens Wiklander *
*b8c186b5SJens Wiklander *  Unless required by applicable law or agreed to in writing, software
*b8c186b5SJens Wiklander *  distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
*b8c186b5SJens Wiklander *  WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
*b8c186b5SJens Wiklander *  See the License for the specific language governing permissions and
*b8c186b5SJens Wiklander *  limitations under the License.
*b8c186b5SJens Wiklander */
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander#include <crypto/aes-gcm.h>
*b8c186b5SJens Wiklander#include <io.h>
*b8c186b5SJens Wiklander#include <kernel/panic.h>
*b8c186b5SJens Wiklander#include <string.h>
*b8c186b5SJens Wiklander#include <tee_api_types.h>
*b8c186b5SJens Wiklander#include <types_ext.h>
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander#include "aes-gcm-private.h"
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander/*
*b8c186b5SJens Wiklander * http://csrc.nist.gov/publications/nistpubs/800-38D/SP-800-38D.pdf
*b8c186b5SJens Wiklander *
*b8c186b5SJens Wiklander * See also:
*b8c186b5SJens Wiklander * [MGV] http://csrc.nist.gov/groups/ST/toolkit/BCM/documents/proposedmodes/gcm/
*b8c186b5SJens Wiklandergcm-revised-spec.pdf
*b8c186b5SJens Wiklander *
*b8c186b5SJens Wiklander * We use the algorithm described as Shoup's method with 4-bit tables in
*b8c186b5SJens Wiklander * [MGV] 4.1, pp. 12-13, to enhance speed without using too much memory.
*b8c186b5SJens Wiklander */
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander/*
*b8c186b5SJens Wiklander * Precompute small multiples of H, that is set
*b8c186b5SJens Wiklander *      HH[i] || HL[i] = H times i,
*b8c186b5SJens Wiklander * where i is seen as a field element as in [MGV], ie high-order bits
*b8c186b5SJens Wiklander * correspond to low powers of P. The result is stored in the same way, that
*b8c186b5SJens Wiklander * is the high-order bit of HH corresponds to P^0 and the low-order bit of HL
*b8c186b5SJens Wiklander * corresponds to P^127.
*b8c186b5SJens Wiklander */
*b8c186b5SJens Wiklandervoid internal_aes_gcm_ghash_gen_tbl(struct internal_aes_gcm_ctx *ctx)
*b8c186b5SJens Wiklander{
*b8c186b5SJens Wiklander	int i, j;
*b8c186b5SJens Wiklander	uint64_t vl, vh;
*b8c186b5SJens Wiklander	unsigned char h[16];
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	memset(h, 0, 16);
*b8c186b5SJens Wiklander	internal_aes_gcm_encrypt_block(ctx, h, h);
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	vh = get_be64(h);
*b8c186b5SJens Wiklander	vl = get_be64(h + 8);
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	/* 8 = 1000 corresponds to 1 in GF(2^128) */
*b8c186b5SJens Wiklander	ctx->HL[8] = vl;
*b8c186b5SJens Wiklander	ctx->HH[8] = vh;
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	/* 0 corresponds to 0 in GF(2^128) */
*b8c186b5SJens Wiklander	ctx->HH[0] = 0;
*b8c186b5SJens Wiklander	ctx->HL[0] = 0;
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	for (i = 4; i > 0; i >>= 1) {
*b8c186b5SJens Wiklander		uint32_t T = (vl & 1) * 0xe1000000U;
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander		vl  = (vh << 63) | (vl >> 1);
*b8c186b5SJens Wiklander		vh  = (vh >> 1) ^ ((uint64_t)T << 32);
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander		ctx->HL[i] = vl;
*b8c186b5SJens Wiklander		ctx->HH[i] = vh;
*b8c186b5SJens Wiklander	}
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	for (i = 2; i <= 8; i *= 2) {
*b8c186b5SJens Wiklander		uint64_t *HiL = ctx->HL + i, *HiH = ctx->HH + i;
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander		vh = *HiH;
*b8c186b5SJens Wiklander		vl = *HiL;
*b8c186b5SJens Wiklander		for (j = 1; j < i; j++) {
*b8c186b5SJens Wiklander			HiH[j] = vh ^ ctx->HH[j];
*b8c186b5SJens Wiklander			HiL[j] = vl ^ ctx->HL[j];
*b8c186b5SJens Wiklander		}
*b8c186b5SJens Wiklander	}
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander}
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander/*
*b8c186b5SJens Wiklander * Shoup's method for multiplication use this table with
*b8c186b5SJens Wiklander *      last4[x] = x times P^128
*b8c186b5SJens Wiklander * where x and last4[x] are seen as elements of GF(2^128) as in [MGV]
*b8c186b5SJens Wiklander */
*b8c186b5SJens Wiklanderstatic const uint64_t last4[16] = {
*b8c186b5SJens Wiklander	0x0000, 0x1c20, 0x3840, 0x2460,
*b8c186b5SJens Wiklander	0x7080, 0x6ca0, 0x48c0, 0x54e0,
*b8c186b5SJens Wiklander	0xe100, 0xfd20, 0xd940, 0xc560,
*b8c186b5SJens Wiklander	0x9180, 0x8da0, 0xa9c0, 0xb5e0
*b8c186b5SJens Wiklander};
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander/*
*b8c186b5SJens Wiklander * Sets output to x times H using the precomputed tables.
*b8c186b5SJens Wiklander * x and output are seen as elements of GF(2^128) as in [MGV].
*b8c186b5SJens Wiklander */
*b8c186b5SJens Wiklanderstatic void gcm_mult(struct internal_aes_gcm_ctx *ctx,
*b8c186b5SJens Wiklander		     const unsigned char x[16], unsigned char output[16])
*b8c186b5SJens Wiklander{
*b8c186b5SJens Wiklander	int i = 0;
*b8c186b5SJens Wiklander	unsigned char lo, hi, rem;
*b8c186b5SJens Wiklander	uint64_t zh, zl;
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	lo = x[15] & 0xf;
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	zh = ctx->HH[lo];
*b8c186b5SJens Wiklander	zl = ctx->HL[lo];
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	for (i = 15; i >= 0; i--) {
*b8c186b5SJens Wiklander		lo = x[i] & 0xf;
*b8c186b5SJens Wiklander		hi = x[i] >> 4;
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander		if (i != 15) {
*b8c186b5SJens Wiklander			rem = (unsigned char)zl & 0xf;
*b8c186b5SJens Wiklander			zl = (zh << 60) | (zl >> 4);
*b8c186b5SJens Wiklander			zh = (zh >> 4);
*b8c186b5SJens Wiklander			zh ^= (uint64_t)last4[rem] << 48;
*b8c186b5SJens Wiklander			zh ^= ctx->HH[lo];
*b8c186b5SJens Wiklander			zl ^= ctx->HL[lo];
*b8c186b5SJens Wiklander		}
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander		rem = (unsigned char)zl & 0xf;
*b8c186b5SJens Wiklander		zl = (zh << 60) | (zl >> 4);
*b8c186b5SJens Wiklander		zh = (zh >> 4);
*b8c186b5SJens Wiklander		zh ^= (uint64_t)last4[rem] << 48;
*b8c186b5SJens Wiklander		zh ^= ctx->HH[hi];
*b8c186b5SJens Wiklander		zl ^= ctx->HL[hi];
*b8c186b5SJens Wiklander	}
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	put_be64(output, zh);
*b8c186b5SJens Wiklander	put_be64(output + 8, zl);
*b8c186b5SJens Wiklander}
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklandervoid internal_aes_gcm_ghash_update_block(struct internal_aes_gcm_ctx *ctx,
*b8c186b5SJens Wiklander					 const void *data)
*b8c186b5SJens Wiklander{
*b8c186b5SJens Wiklander	void *y = ctx->hash_state;
*b8c186b5SJens Wiklander
*b8c186b5SJens Wiklander	internal_aes_gcm_xor_block(y, data);
*b8c186b5SJens Wiklander	gcm_mult(ctx, y, y);
*b8c186b5SJens Wiklander}