core/crypto/aes-gcm-ghash-tbl.c

b8c186b5SJens Wiklander/*
b8c186b5SJens Wiklander *  NIST SP800-38D compliant GCM implementation
b8c186b5SJens Wiklander *
b8c186b5SJens Wiklander *  Copyright (C) 2006-2015, ARM Limited, All Rights Reserved
b8c186b5SJens Wiklander *  SPDX-License-Identifier: Apache-2.0
b8c186b5SJens Wiklander *
b8c186b5SJens Wiklander *  Licensed under the Apache License, Version 2.0 (the "License"); you may
b8c186b5SJens Wiklander *  not use this file except in compliance with the License.
b8c186b5SJens Wiklander *  You may obtain a copy of the License at
b8c186b5SJens Wiklander *
b8c186b5SJens Wiklander *  http://www.apache.org/licenses/LICENSE-2.0
b8c186b5SJens Wiklander *
b8c186b5SJens Wiklander *  Unless required by applicable law or agreed to in writing, software
b8c186b5SJens Wiklander *  distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
b8c186b5SJens Wiklander *  WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
b8c186b5SJens Wiklander *  See the License for the specific language governing permissions and
b8c186b5SJens Wiklander *  limitations under the License.
b8c186b5SJens Wiklander */
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander#include <crypto/aes-gcm.h>
b8c186b5SJens Wiklander#include <io.h>
b8c186b5SJens Wiklander#include <kernel/panic.h>
b8c186b5SJens Wiklander#include <string.h>
b8c186b5SJens Wiklander#include <tee_api_types.h>
b8c186b5SJens Wiklander#include <types_ext.h>
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander#include "aes-gcm-private.h"
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander/*
b8c186b5SJens Wiklander * http://csrc.nist.gov/publications/nistpubs/800-38D/SP-800-38D.pdf
b8c186b5SJens Wiklander *
b8c186b5SJens Wiklander * See also:
b8c186b5SJens Wiklander * [MGV] http://csrc.nist.gov/groups/ST/toolkit/BCM/documents/proposedmodes/gcm/
b8c186b5SJens Wiklandergcm-revised-spec.pdf
b8c186b5SJens Wiklander *
b8c186b5SJens Wiklander * We use the algorithm described as Shoup's method with 4-bit tables in
b8c186b5SJens Wiklander * [MGV] 4.1, pp. 12-13, to enhance speed without using too much memory.
b8c186b5SJens Wiklander */
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander/*
b8c186b5SJens Wiklander * Precompute small multiples of H, that is set
b8c186b5SJens Wiklander *      HH[i] || HL[i] = H times i,
b8c186b5SJens Wiklander * where i is seen as a field element as in [MGV], ie high-order bits
b8c186b5SJens Wiklander * correspond to low powers of P. The result is stored in the same way, that
b8c186b5SJens Wiklander * is the high-order bit of HH corresponds to P^0 and the low-order bit of HL
b8c186b5SJens Wiklander * corresponds to P^127.
b8c186b5SJens Wiklander */
*54af8d67SJens Wiklandervoid internal_aes_gcm_ghash_gen_tbl(struct internal_aes_gcm_state *state,
*54af8d67SJens Wiklander				    const struct internal_aes_gcm_key *ek)
b8c186b5SJens Wiklander{
b8c186b5SJens Wiklander	int i, j;
b8c186b5SJens Wiklander	uint64_t vl, vh;
b8c186b5SJens Wiklander	unsigned char h[16];
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander	memset(h, 0, 16);
*54af8d67SJens Wiklander	internal_aes_gcm_encrypt_block(ek, h, h);
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander	vh = get_be64(h);
b8c186b5SJens Wiklander	vl = get_be64(h + 8);
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander	/* 8 = 1000 corresponds to 1 in GF(2^128) */
*54af8d67SJens Wiklander	state->HL[8] = vl;
*54af8d67SJens Wiklander	state->HH[8] = vh;
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander	/* 0 corresponds to 0 in GF(2^128) */
*54af8d67SJens Wiklander	state->HH[0] = 0;
*54af8d67SJens Wiklander	state->HL[0] = 0;
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander	for (i = 4; i > 0; i >>= 1) {
b8c186b5SJens Wiklander		uint32_t T = (vl & 1) * 0xe1000000U;
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander		vl  = (vh << 63) | (vl >> 1);
b8c186b5SJens Wiklander		vh  = (vh >> 1) ^ ((uint64_t)T << 32);
b8c186b5SJens Wiklander
*54af8d67SJens Wiklander		state->HL[i] = vl;
*54af8d67SJens Wiklander		state->HH[i] = vh;
b8c186b5SJens Wiklander	}
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander	for (i = 2; i <= 8; i *= 2) {
*54af8d67SJens Wiklander		uint64_t *HiL = state->HL + i, *HiH = state->HH + i;
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander		vh = *HiH;
b8c186b5SJens Wiklander		vl = *HiL;
b8c186b5SJens Wiklander		for (j = 1; j < i; j++) {
*54af8d67SJens Wiklander			HiH[j] = vh ^ state->HH[j];
*54af8d67SJens Wiklander			HiL[j] = vl ^ state->HL[j];
b8c186b5SJens Wiklander		}
b8c186b5SJens Wiklander	}
b8c186b5SJens Wiklander}
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander/*
b8c186b5SJens Wiklander * Shoup's method for multiplication use this table with
b8c186b5SJens Wiklander *      last4[x] = x times P^128
b8c186b5SJens Wiklander * where x and last4[x] are seen as elements of GF(2^128) as in [MGV]
b8c186b5SJens Wiklander */
b8c186b5SJens Wiklanderstatic const uint64_t last4[16] = {
b8c186b5SJens Wiklander	0x0000, 0x1c20, 0x3840, 0x2460,
b8c186b5SJens Wiklander	0x7080, 0x6ca0, 0x48c0, 0x54e0,
b8c186b5SJens Wiklander	0xe100, 0xfd20, 0xd940, 0xc560,
b8c186b5SJens Wiklander	0x9180, 0x8da0, 0xa9c0, 0xb5e0
b8c186b5SJens Wiklander};
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander/*
b8c186b5SJens Wiklander * Sets output to x times H using the precomputed tables.
b8c186b5SJens Wiklander * x and output are seen as elements of GF(2^128) as in [MGV].
b8c186b5SJens Wiklander */
*54af8d67SJens Wiklanderstatic void gcm_mult(struct internal_aes_gcm_state *state,
b8c186b5SJens Wiklander		     const unsigned char x[16], unsigned char output[16])
b8c186b5SJens Wiklander{
b8c186b5SJens Wiklander	int i = 0;
b8c186b5SJens Wiklander	unsigned char lo, hi, rem;
b8c186b5SJens Wiklander	uint64_t zh, zl;
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander	lo = x[15] & 0xf;
b8c186b5SJens Wiklander
*54af8d67SJens Wiklander	zh = state->HH[lo];
*54af8d67SJens Wiklander	zl = state->HL[lo];
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander	for (i = 15; i >= 0; i--) {
b8c186b5SJens Wiklander		lo = x[i] & 0xf;
b8c186b5SJens Wiklander		hi = x[i] >> 4;
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander		if (i != 15) {
b8c186b5SJens Wiklander			rem = (unsigned char)zl & 0xf;
b8c186b5SJens Wiklander			zl = (zh << 60) | (zl >> 4);
b8c186b5SJens Wiklander			zh = (zh >> 4);
b8c186b5SJens Wiklander			zh ^= (uint64_t)last4[rem] << 48;
*54af8d67SJens Wiklander			zh ^= state->HH[lo];
*54af8d67SJens Wiklander			zl ^= state->HL[lo];
b8c186b5SJens Wiklander		}
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander		rem = (unsigned char)zl & 0xf;
b8c186b5SJens Wiklander		zl = (zh << 60) | (zl >> 4);
b8c186b5SJens Wiklander		zh = (zh >> 4);
b8c186b5SJens Wiklander		zh ^= (uint64_t)last4[rem] << 48;
*54af8d67SJens Wiklander		zh ^= state->HH[hi];
*54af8d67SJens Wiklander		zl ^= state->HL[hi];
b8c186b5SJens Wiklander	}
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander	put_be64(output, zh);
b8c186b5SJens Wiklander	put_be64(output + 8, zl);
b8c186b5SJens Wiklander}
b8c186b5SJens Wiklander
*54af8d67SJens Wiklandervoid internal_aes_gcm_ghash_update_block(struct internal_aes_gcm_state *state,
b8c186b5SJens Wiklander					 const void *data)
b8c186b5SJens Wiklander{
*54af8d67SJens Wiklander	void *y = state->hash_state;
b8c186b5SJens Wiklander
b8c186b5SJens Wiklander	internal_aes_gcm_xor_block(y, data);
*54af8d67SJens Wiklander	gcm_mult(state, y, y);
b8c186b5SJens Wiklander}